雷峰网消息,9月20日的gtc活动上,英伟达ceo黄仁勋在演讲中发布了万众瞩目的英伟达新一代游戏显卡 rtx40系列。
本次英伟达共发布了三款显卡,分别是rtx 40系旗舰显卡rtx 4090与定位高端的rtx 4080 16gb、rtx 4080 12gb。
rtx 40系列显卡采用了新一代rtx架构,计算能力再次实现跨越式发展。而光追技术的全新升级与dlss3的加入,也为游戏玩家带来了全新的升级体验。
rtx 4090显卡将在10月12日上市,而rtx 4080显卡则将在11月上市。
加量也加价,40系显卡性能、价格双「越级」
rtx4090采用了全新的第三代rtx架构,并使用台积电4n工艺制造。
新一代rtx以世界上第一位计算机程序员ada lovelace的名字命名,黄仁勋在演讲中表示,得益于英伟达与台积电的紧密合作,专为gpu制造优化的4n工艺让ada lovelace架构能够集成760亿个晶体管和超过18000个cuda核心,较上一代ampere架构多70%,能耗比相较ampere则提升一倍。
图 新一代ada架构
采用了ada架构的40系显卡在性能表现上远远超过前辈30系显卡。
旗舰定位的rtx 4090集成了760亿个晶体管、16384个cuda核心,并拥有24gb显存。
英伟达表示,在强大硬件指标的加持下,rtx 4090显卡即使在4k分辨率下,依然可以获得超过100fps的流畅游戏体验。
能效方面,rtx 4090功率为450w,与rtx 3090ti保持一致,但英伟达称在同样功率下,4090的游戏表现较rtx 3090ti提升一倍。
定位低一档的rtx 4080则有16gb与12gb两个显存版本,16gb版本集成了9728个duda核心。英伟达称rtx 4080 16gb的游戏性能两倍于rtx 3080,并超过了上一代旗舰rtx 3090 ti。
而12gb版本的rtx 4080则集成了7680个cuda核心,理论性能也超越了上一代旗舰rtx 3090 ti。
全新架构还搭载了opacity micromap引擎,将光线追踪的alpha-test集合性能提升2倍。全新的micro-mesh引擎则能够在不带来更多的bvh构建和存储资源消耗的前提下提升图形的丰富度。
最后,全新tensor core新增了hooper fp8 transformer engine可以提供1.4 petaflops张量处理性能。在性能获得巨大升级的同时,这一代英伟达游戏显卡的价格也再创新高。
rtx 4090建议零售价为12999人民币起,相比上一代rtx 3090 11999元的其售价涨价1000元。
图 rtx40系列显卡售价
而rtx 4080价格则上探到了9499元,相较上一代rtx 3080 5499元的起售价可谓完成“消费升级”。即使结合英伟达本代显卡将没有rtx 4080ti的传闻,rtx 4080 16gb的其售价也比上一代同定位的rtx 3080 ti的9499元略有提价。
更低配置的rtx 4080 12gb的其售价也高达7199元,与上一代同定位的rtx 3070ti的4499元售价也涨势凶猛。
光追再升级,游戏中ai“偷天换日”
本次rtx 40系列显卡最重要的升级之一就是对光线追踪技术的升级。
rtx系列显卡最初问世就以光线追踪为特色功能,本次40系的更新更是“牙膏挤爆”,正如英伟达ceo黄仁勋所说:“英伟达重新定义了图形。”
新的ada lovelace架构具有高达90tflops的着色器能力,吞吐量超过上一代产品两倍。除此之外,ada架构的sm多单元流处理器还使用了着色器重排序技术(ser),可实现对任务的实时重新调度。黄仁勋强调这项技术对gpu来说是革命性的,原理上与cpu的乱序执行技术类似。
对于这项技术,黄仁勋在演讲中解释道,光线追踪的工作负载需要不同的线程处理,不同着色器之间很难合并工作,ser技术则能够即时安排着色器负载,从而提高执行效率,更好地利用gpu资源,打造更好的光线追踪效果。
图ser技术工作原理
这项技术能够让英伟达显卡光线追踪性能提升2-3倍,整体游戏性能提升25%。
在提升计算能力之外,英伟达还通过多种方式提升终端游戏体验。在演讲中,黄仁勋表示,和加速计算一样,计算机图形的也是一项全栈挑战。要实现突破还需要在架构、设计和算法上创新。
此前在rtx显卡上始终扮演着重要角色的dlss技术本次也迎来了重大更新。
在rtx显卡上,dlss技术一直是光线追踪技术的重要“搭档”:光线追踪模拟出更真实、更贴近现实效果的游戏场景,dlss技术则利用ai算法降低模拟这样的真实物理环境所需要的计算量,保证用户流畅的游戏体验。
这次,第三代dlss技术同rtx 40系显卡一同登场,并带来了开创性的光学多帧生成功能。
与之前最大的不同在于,第三代dlss技术生成的不再是像素,而是全面的画面帧。
基于ada lovelace架构的新光流加速器,第三代dlss技术可以分析两帧连续的游戏图像,并向神经网络输入像素级的从帧到帧的运动方向和速度信息,此后神经网络模型将据此计算出中间帧。
这样的中间帧由神经网络计算生成,不再涉及图形渲染,完全独立于游戏。这能够大大减轻游戏中即时演算的运算量。
通俗的讲,游戏中的画面是由gpu这个“画家“通过算力的”画笔“创造的,dlss3技术能在两张画作之间插入了一张ai生成的”照片“,从而彻底解放gpu”画家“的双手。
英伟达表示第三代dlss技术相较于单纯渲染的方式可以将游戏性能提高4倍。
黄仁勋表示,dlss 3能够为ada gpu带来远高于cpu可计算的帧率,从而让一些对cpu要求较高的游戏也从中受益。
在现场,英伟达展示了两款对cpu要求较高的游戏,在开启dlss3后,《赛博朋克2077》与《微软模拟飞行》的帧率增加都超过一倍,达到90帧以上。
图开启dlss3前后,《微软模拟飞行》帧率变化
《传送门》连接过往与将来,英伟达冲向凯发国际娱乐官
游戏,是rtx 40系列发布时一个重要话题。
在发布40系显卡的同时,本次英伟达还颇有复古精神的带来了经典游戏《传送门》重制版。
这款被称为《传送门rtx》的游戏,实际上是英伟达基于其元宇宙创作平台onmiverse创建的一个mod。
图使用光追技术的《传送门》重制版
英伟达巧妙地用《传送门》,连接起了过去和未来。
正如这一经典游戏的玩法:开启传送门,走向另一端。
在英伟达看来,传送门的另一端无疑是属于元宇宙的世界。
黄仁勋表示,mod是一种受众庞大的游戏文化,各种游戏mod每年下载量已经突破数十亿次。在10款最热门的竞技游戏中,有9款都能见到mod的身影。
英伟达为游戏mod设计者打造了一款名为rtx remix的ominverse应用。
基于该工具,游戏开发者可以为各种经典游戏制作mod添加rtx光追效果。
基于该工具,mod制作者需要将游戏导入usd中,然后使用modding工具来创建光线追踪mod,并导出至rtx渲染器。该工具还使用ai技术,以提升mod材质的质感。
英伟达在几年前就已经创建了名为onmiverse的元宇宙创意平台,让元宇宙开发者可以通过这个3d平台互相连接并共同协作。
无论是rtx 40系列显卡更强的gpu算力,还是更真实的光追效果,都无疑将会为元宇宙的生态贡献更强的力量。
在老黄演讲的开头,是一段racerx演示的demo。racerx是基于omniverse构建的全交互式仿真演示,其中所有的基于现实物理规律,所有光照、反射和折射则采用光线追踪技术。
这也许昭示着英伟达眼中的未来:在更加强大的显卡性能与ai能力加持下的更加真实的游戏体验和元宇宙场景。