RTX 40 系显卡 GTC「炸场」发布,性能提升 70%,价格再创新高

RTX 40 系显卡 GTC「炸场」发布,性能提升 70%,价格再创新高,第1张

RTX 40 系显卡 GTC「炸场」发布,性能提升 70%,价格再创新高

据雷锋网报道。com,在9月20日的GTC活动上,英伟达CEO黄仁勋在演讲中发布了备受期待的英伟达新一代游戏显卡RTX40系列。

这次Nvidia发布了三款显卡,分别是RTX 40系列的旗舰显卡RTX 4090,以及定位高端的RTX 4080 16GB和RTX 4080 12GB。

RTX 40系列显卡采用新一代RTX架构,计算能力再次实现跨越式发展。光追技术的全新升级和DLSS3的加入也为游戏玩家带来了全新的升级体验。

RTX 4090显卡将于10月12日上市,而RTX 4080显卡将于11月上市。

量的增加也增加了价格,40系显卡性能和价格双“越级”

RTX4090采用全新的第三代RTX架构,采用TSMC 4N工艺制造。

新一代RTX是以世界上第一个计算机程序员阿达·洛芙莱斯的名字命名的。黄仁勋在演讲中表示,得益于英伟达和TSMC的紧密合作,针对GPU制造优化的 4N工艺使阿达·洛芙莱斯架构集成了760亿个晶体管和18000多个CUDA内核,比上一代Ampere架构增加了70%,能耗相比Ampere增加了一倍。

图新一代Ada架构

Ada架构的40系显卡性能远超30系显卡。

旗舰产品RTX 4090集成了760亿个晶体管,16,384个CUDA内核,并拥有24GB的视频内存。

英伟达表示,在强大硬件指标的加持下,RTX 4090显卡即使在4K分辨率下,依然可以获得超过100FPS的流畅游戏体验。

在能效方面,RTX 4090的功率为450W,与RTX 3090Ti一致。但是英伟达声称4090的游戏性能比同功率的RTX 3090Ti高一倍。

定位较低档的RTX 4080有16GB和12GB两个内存版本。16GB版本集成了9728个DUDA核心。英伟达声称,RTX 4080 16GB的游戏性能是RTX 3080的两倍,并超过了上一代旗舰RTX 3090 Ti。

12GB版本的RTX 4080集成了7680个CUDA核心,理论性能超越上一代旗舰RTX 3090 Ti。

新架构还配备了Opacity Micromap引擎,将光线追踪Alpha-Test set的性能提升了2倍。新的微网格引擎可以提高图形的丰富性,而不会消耗更多的BVH构建和存储资源。

最后,新的张量核心增加了Hooper FP8 Transformer引擎,可以提供1.4 petaFLOPS的张量处理性能。在性能大幅升级的同时,这一代NVIDIA游戏显卡的价格又创新高

RTX 4090的建议零售价为12999元起,比上一代产品RTX 3090-11999元高出1000元。

图RTX 40系列显卡价格

而RTX 4080的售价则达到了9499元,相比上一代RTX 3080 5499元的起售价可谓是“消费升级”。即使不会出现RTX 4080Ti结合英伟达的显卡的传闻,但RTX 4080 16GB的价格还是略高于上一代同定位9499元的RTX 3080 Ti。

配置更低的RTX 4080 12GB价格高达7199元,与上一代定位相同的RTX 3070Ti价格也在4499元的基础上凶猛上涨。

在游戏中,AI“窃天换日”

RTX 40系列显卡最重要的升级之一就是光线追踪技术的升级。

RTX系列显卡从一开始就具有光线追踪功能,这次40系列的更新是“牙膏爆炸”。正如英伟达CEO黄仁勋所说,“英伟达重新定义了图形。”

新的阿达·洛芙莱斯架构具有高达90TFLOPs的着色器能力,其吞吐量是上一代的两倍。此外,基于ADA架构的SM多单元流处理器还采用了着色器重排序技术(SER),可以实现任务的实时重调度。强调黄仁勋的这项技术对于GPU 来说是革命性的,原理上类似于CPU的乱序执行技术。

对于这项技术,黄仁勋在演讲中解释道,光线追踪的工作量需要不同的线程处理,很难将不同着色器之间的工作结合起来。SER技术可以立即安排着色器加载,从而提高执行效率,更好地利用GPU资源,创造更好的光线追踪效果。

SER技术的工作原理

这项技术可以将NVIDIA显卡的光线追踪性能提升2-3倍,整体游戏性能提升25%。

除了提升计算能力,Nvidia还在多方面提升终端游戏体验。在他的演讲中,黄仁勋说,像加速计算一样,计算机图形也是一个全栈挑战。要实现突破,需要在架构、设计、算法上创新。

之前一直在RTX显卡中扮演重要角色的DLSS科技,这次也迎来了重大更新。

在RTX显卡上,DLSS科技一直是光线追踪技术的重要“合作伙伴”:光线追踪模拟出更加真实逼真的游戏场景,而DLSS科技则利用AI算法来降低模拟这样真实的物理环境所需的计算量,以保证用户流畅的游戏体验。

此次,第三代DLSS技术与RTX 40系列显卡一同亮相,并带来了开创性的光学多帧生成功能。

最大的不同是,第三代DLSS技术不再是一个像素,而是一个全面的图片框架。

基于阿达·洛芙莱斯架构的新型光流加速器,第三代DLSS技术可以分析连续两幅游戏图像,将像素级的运动方向和速度信息逐帧输入神经网络,之后神经网络模型将计算中间帧。

这个中间帧由神经网络计算生成,不再涉及图形渲染,完全独立于游戏。这样可以大大减少游戏中实时微积分的计算量。

一般来说,游戏中的画面都是由GPU“画师”通过计算能力的“画笔”创作出来的。DLSS3技术可以在两幅画之间插入一张AI生成的“照片”,从而彻底解放GPU“画师”的双手。

英伟达表示,与简单的渲染方法相比,第三代DLSS技术可以将游戏性能提高4倍。

黄仁勋表示,DLSS 3可以给Ada GPU带来远高于CPU计算的帧率,从而惠及一些对CPU要求较高的游戏。

现场,Nvidia展示了两款对CPU要求很高的游戏。打开DLSS3后,赛博朋克2077和微软飞行模拟器的帧率提高了一倍多,达到90帧以上。

图开启DLSS3前后微软飞行模拟器帧率变化

《传送门》连接过去与未来,英伟达冲向超宇宙

游戏是RTX 40系列发布时的一个重要话题。

在发布40系显卡的同时,这一次Nvidia也为经典游戏门户的翻拍带来了一股复古精神。

这款名为《传送门RTX》的游戏实际上是英伟达基于其超宇宙创造平台onmiverse打造的mod。

使用照片追踪技术重新制作的门户版本

Nvidia巧妙地用Portal连接了过去和未来。

就像这个经典游戏:打开传送门,去另一端。

在英伟达看来,传送门的另一端无疑是属于元宇宙的世界。

黄仁勋表示,mod是一种游戏文化,拥有庞大的受众群体,各种游戏mod的下载量每年都超过数十亿次。10款最受欢迎的竞技游戏中有9款可以看到Mod。

Nvidia为游戏mod设计者创建了一个名为RTX混音的Ominverse应用程序。

基于这个工具,游戏开发者可以在各种经典游戏制作mod中加入RTX追光效果。

基于这个工具,mod制作者需要将游戏导入USD,然后使用modding工具创建光线追踪mod并将其导出到RTX渲染器。该工具还使用AI技术来改善mod材料的纹理。

Nvidia在几年前创建了一个名为Onmiverse的元宇宙创意平台,允许元宇宙开发者通过这个3D平台相互联系和合作。

无论是RTX 40系列显卡拥有更强的GPU计算能力,还是更逼真的追光效果,无疑都将为元宇宙的生态做出贡献。

老黄演讲的开头,有一段RacerX演示的demo。RacerX是基于Omniverse的全交互仿真演示,所有的一切都是基于真实物理的规律,所有的光照、反射、折射都是基于光线追踪技术。

这可能预示着Nvidia眼中的未来:更真实的游戏体验和元宇宙场景,更强大的图形性能和AI能力。

欢迎分享,转载请注明来源:聚客百科

原文地址: https://juke.outofmemory.cn/life/1831776.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-09-29
下一篇 2022-09-29

发表评论

登录后才能评论

评论列表(0条)

保存