RTX 40 系显卡 GTC「炸场」发布，性能提升 70%，价格再创新高

斩赤红之瞳第二季2022-09-29 23

据雷锋网报道。com，在9月20日的GTC活动上，英伟达CEO黄仁勋在演讲中发布了备受期待的英伟达新一代游戏显卡RTX40系列。

这次Nvidia发布了三款显卡，分别是RTX 40系列的旗舰显卡RTX 4090，以及定位高端的RTX 4080 16GB和RTX 4080 12GB。

RTX 40系列显卡采用新一代RTX架构，计算能力再次实现跨越式发展。光追技术的全新升级和DLSS3的加入也为游戏玩家带来了全新的升级体验。

RTX 4090显卡将于10月12日上市，而RTX 4080显卡将于11月上市。

量的增加也增加了价格，40系显卡性能和价格双“越级”

RTX4090采用全新的第三代RTX架构，采用TSMC 4N工艺制造。

新一代RTX是以世界上第一个计算机程序员阿达·洛芙莱斯的名字命名的。黄仁勋在演讲中表示，得益于英伟达和TSMC的紧密合作，针对GPU制造优化的 4N工艺使阿达·洛芙莱斯架构集成了760亿个晶体管和18000多个CUDA内核，比上一代Ampere架构增加了70%，能耗相比Ampere增加了一倍。

图新一代Ada架构

Ada架构的40系显卡性能远超30系显卡。

旗舰产品RTX 4090集成了760亿个晶体管，16，384个CUDA内核，并拥有24GB的视频内存。

英伟达表示，在强大硬件指标的加持下，RTX 4090显卡即使在4K分辨率下，依然可以获得超过100FPS的流畅游戏体验。

在能效方面，RTX 4090的功率为450W，与RTX 3090Ti一致。但是英伟达声称4090的游戏性能比同功率的RTX 3090Ti高一倍。

定位较低档的RTX 4080有16GB和12GB两个内存版本。16GB版本集成了9728个DUDA核心。英伟达声称，RTX 4080 16GB的游戏性能是RTX 3080的两倍，并超过了上一代旗舰RTX 3090 Ti。

12GB版本的RTX 4080集成了7680个CUDA核心，理论性能超越上一代旗舰RTX 3090 Ti。

新架构还配备了Opacity Micromap引擎，将光线追踪Alpha-Test set的性能提升了2倍。新的微网格引擎可以提高图形的丰富性，而不会消耗更多的BVH构建和存储资源。

最后，新的张量核心增加了Hooper FP8 Transformer引擎，可以提供1.4 petaFLOPS的张量处理性能。在性能大幅升级的同时，这一代NVIDIA游戏显卡的价格又创新高。

RTX 4090的建议零售价为12999元起，比上一代产品RTX 3090-11999元高出1000元。

图RTX 40系列显卡价格

而RTX 4080的售价则达到了9499元，相比上一代RTX 3080 5499元的起售价可谓是“消费升级”。即使不会出现RTX 4080Ti结合英伟达的显卡的传闻，但RTX 4080 16GB的价格还是略高于上一代同定位9499元的RTX 3080 Ti。

配置更低的RTX 4080 12GB价格高达7199元，与上一代定位相同的RTX 3070Ti价格也在4499元的基础上凶猛上涨。

在游戏中，AI“窃天换日”

RTX 40系列显卡最重要的升级之一就是光线追踪技术的升级。

RTX系列显卡从一开始就具有光线追踪功能，这次40系列的更新是“牙膏爆炸”。正如英伟达CEO黄仁勋所说，“英伟达重新定义了图形。”

新的阿达·洛芙莱斯架构具有高达90TFLOPs的着色器能力，其吞吐量是上一代的两倍。此外，基于ADA架构的SM多单元流处理器还采用了着色器重排序技术(SER)，可以实现任务的实时重调度。强调黄仁勋的这项技术对于GPU 来说是革命性的，原理上类似于CPU的乱序执行技术。

对于这项技术，黄仁勋在演讲中解释道，光线追踪的工作量需要不同的线程处理，很难将不同着色器之间的工作结合起来。SER技术可以立即安排着色器加载，从而提高执行效率，更好地利用GPU资源，创造更好的光线追踪效果。

SER技术的工作原理

这项技术可以将NVIDIA显卡的光线追踪性能提升2-3倍，整体游戏性能提升25%。

除了提升计算能力，Nvidia还在多方面提升终端游戏体验。在他的演讲中，黄仁勋说，像加速计算一样，计算机图形也是一个全栈挑战。要实现突破，需要在架构、设计、算法上创新。

之前一直在RTX显卡中扮演重要角色的DLSS科技，这次也迎来了重大更新。

在RTX显卡上，DLSS科技一直是光线追踪技术的重要“合作伙伴”:光线追踪模拟出更加真实逼真的游戏场景，而DLSS科技则利用AI算法来降低模拟这样真实的物理环境所需的计算量，以保证用户流畅的游戏体验。

此次，第三代DLSS技术与RTX 40系列显卡一同亮相，并带来了开创性的光学多帧生成功能。

最大的不同是，第三代DLSS技术不再是一个像素，而是一个全面的图片框架。

基于阿达·洛芙莱斯架构的新型光流加速器，第三代DLSS技术可以分析连续两幅游戏图像，将像素级的运动方向和速度信息逐帧输入神经网络，之后神经网络模型将计算中间帧。

这个中间帧由神经网络计算生成，不再涉及图形渲染，完全独立于游戏。这样可以大大减少游戏中实时微积分的计算量。

一般来说，游戏中的画面都是由GPU“画师”通过计算能力的“画笔”创作出来的。DLSS3技术可以在两幅画之间插入一张AI生成的“照片”，从而彻底解放GPU“画师”的双手。

英伟达表示，与简单的渲染方法相比，第三代DLSS技术可以将游戏性能提高4倍。

黄仁勋表示，DLSS 3可以给Ada GPU带来远高于CPU计算的帧率，从而惠及一些对CPU要求较高的游戏。

现场，Nvidia展示了两款对CPU要求很高的游戏。打开DLSS3后，赛博朋克2077和微软飞行模拟器的帧率提高了一倍多，达到90帧以上。

图开启DLSS3前后微软飞行模拟器帧率变化

《传送门》连接过去与未来，英伟达冲向超宇宙

游戏是RTX 40系列发布时的一个重要话题。

在发布40系显卡的同时，这一次Nvidia也为经典游戏门户的翻拍带来了一股复古精神。

这款名为《传送门RTX》的游戏实际上是英伟达基于其超宇宙创造平台onmiverse打造的mod。

使用照片追踪技术重新制作的门户版本

Nvidia巧妙地用Portal连接了过去和未来。

就像这个经典游戏:打开传送门，去另一端。

在英伟达看来，传送门的另一端无疑是属于元宇宙的世界。

黄仁勋表示，mod是一种游戏文化，拥有庞大的受众群体，各种游戏mod的下载量每年都超过数十亿次。10款最受欢迎的竞技游戏中有9款可以看到Mod。

Nvidia为游戏mod设计者创建了一个名为RTX混音的Ominverse应用程序。

基于这个工具，游戏开发者可以在各种经典游戏制作mod中加入RTX追光效果。

基于这个工具，mod制作者需要将游戏导入USD，然后使用modding工具创建光线追踪mod并将其导出到RTX渲染器。该工具还使用AI技术来改善mod材料的纹理。

Nvidia在几年前创建了一个名为Onmiverse的元宇宙创意平台，允许元宇宙开发者通过这个3D平台相互联系和合作。

无论是RTX 40系列显卡拥有更强的GPU计算能力，还是更逼真的追光效果，无疑都将为元宇宙的生态做出贡献。

老黄演讲的开头，有一段RacerX演示的demo。RacerX是基于Omniverse的全交互仿真演示，所有的一切都是基于真实物理的规律，所有的光照、反射、折射都是基于光线追踪技术。

这可能预示着Nvidia眼中的未来:更真实的游戏体验和元宇宙场景，更强大的图形性能和AI能力。

转载请注明原文地址:https://juke.outofmemory.cn/read/1831776.html

00 生成海报

RTX 40 系显卡 GTC「炸场」发布，性能提升 70%，价格再创新高

再创

新高

显卡

性能

提升

电脑进水了黑屏怎么办

钉钉会议摄像头怎么关（电脑钉钉会议摄像头关闭方法）