论文部分内容阅读
2020年9月2日,NVIDIA正式发布了3款基于全新8nm安培架构的RTX 30系列显卡,定位于次旗舰的RTX 3080在16日已经正式发布上市,市场反应非常激烈,上架即断货。如今新一代性能怪兽RTX 3090也揭开了它的神秘面纱,那么RTX 3090显卡的实战性能到底如何?8K分辨率下是否真能流畅游戏?24GB显存用处何在?且随我们一起来看个究竟吧。
对于本次的NVIDIA GeForce RTX 3090,老黄(NVIDIA CEO黄仁勋)在发布会上创造了一个词“BFGPU”( a Big Ferocious GPU)来专门形容它,直译为“一個大且凶猛的GPU”,从字面意思也能看出NVIDIA对其的期望。
它瞄准的不再是4K/60fps这个目标,而是更远大的理想——8K/60fps,16倍于1080P的计算量、4倍于4K的计算量。当然,8K/60fps是在全新的DLSS(深度学习超级采样)技术下完成的,并非原生8K输出。而DLSS技术,也被老黄称为近十年来最大的突破。
在2013年,NVIDIA发布了第一款TITAN GPU,在过去的数年中,TITAN系列产品都只以公版的形式限量发售。而显存容量则是TITAN系列产品的定义特征之一,TITAN系列提供的显存容量比同时代的GeForce系列游戏显卡更大,让人工智能、AI深度学习等相关从业者拥有处理更大数据量的能力。随着用户对具有大显存容量TITAN系列产品需求的增多,NVIDIA也在本次RTX 3090上直接下放了显存规格,能够同时满足创意工作者和8K游戏在显存方面的巨大需求。
为了实现这个宏远的目标,NVIDIA GeForce RTX 3090的规格自然也是十分的强大。其配备了GA102-300 GPU核心,比RTX 3080上搭载的GA102-200更加完整,拥有10496个CUDA核心,328个第三代AI人工智能核心TENSOR Core,82个第二代光线追踪核心,配备了24GB GDDR6X显存,384bit 位宽,最大带宽为936Gbps。GPU核心频率1.70GHz ,实现了35.6 TFLOPs的性能,可以应对最具挑战性的人工智能算法,并满足大规模内容创作的需求。
NVIDIA GeForce RTX 3090也是世界上第一款能够支持8K HDR游戏的显卡,可在RTX开启、DLSS 8K和HDR Shadowplay功能下运行8K游戏,帧率能达到60fps,相比于Titan RTX快了50%。所以无论是从发展史、规格上来说,RTX 3090都是一块定位于TITAIN级的位于性能巅峰的GPU。当然,从价格来说,它和上代RTX 2080 Ti的定价基本持平。GeForce RTX 3090能够同时满足精英创作者的高负载工作场景和追逐游戏性能巅峰的游戏玩家。
关于NVIDIA RTX 30系列的整体提升和黑科技在之前RTX 3080的首发测试中我们已经进行过详细的分析,这里就不再赘述,只针对RTX 3090比较独特的点进行详细的分析。
由于8K数据流的需求更为庞大,目前的HDMI 2.0b和DP1.4a均无法实现单条数据线传输8K/60fps/HDR数据流(HDMI2.0需要4条数据线),而HDMI2.1则可以很好地解决这一问题。GeForce RTX 3090是首批支持 HDMI 2.1 的 GPU,也是目前第一批能在8K HDR电视上支持HDMI2.1单条数据线输出的GPU之一,极大地简化了连接。
当然,即使解决了传输问题,想要实现以8K/60fps指标流畅运行3A游戏大作,依旧对GPU是一个极大的考验,毕竟每秒GPU需要绘制的图像像素量已经达到了4K的4倍,这显然已经超出当代GPU规格能够完成的事情。所以针对8K游戏来说,NVIDIA引入了全新的DLSS超高性能图像质量模式,在原有的基础上,提供了9倍AI超分辨率缩放,可以将1440P(2K)AI缩放至8K,从而实现8K/60fps流畅游戏。同时,在新版的GeForce Experience软件中,玩家还可以通过RTX 30系显卡的8K HDR 30 fps录制功能,直接录制8K视频,而不再需要使用高价的采集卡来采集游戏画面。
除了实现游戏方面对8K分辨率的优化,RTX 3090还是首批支持硬件加速的AV1解码以实现流畅8K 60 fps播放的GPU之一,与现有的H.264、H.265(HEVC)、VP9解码器相比,效率更高。AV1将播放高分辨率视频所需的带宽降低了多达50%(通常H264进行8K播放至少需要140 Mbps的带宽),使其成为下一代4K和8K HDR在线视频的理想选择。
另外,NVIDIA RTX 30系列目前只有RTX 3090搭载了新一代NVLink接口,且只支持2 WayNVLink,玩家们谈了多年的“四路泰坦抱回家”的梗就此终结了。
NVIDIA RTX 3090的24GB GDDR6X大显存在生产力和游戏方面具体体现了哪些优势呢?下面我们通过几个简单的测试来一起看看。
在OctaneRender渲染器的Demo独立版中,我们载入一个4GB左右的场景文件并进行渲染。RTX3090仅使用37秒就完成了渲染,显存占用了13954MB,没有使用系统内存进行核心外渲染。
轉而使用RTX 3080进行同一个场景的渲染就会发现,OctaneRender渲染器会提示调用系统内存进行了核心外渲染,从而导致渲染时间大幅延长。渲染结束后我们可以从性能指示器看到,RTX 3080使用了7055MB显存,同时调用了6899MB系统内存,而整个渲染过程长达545秒。
很显然,在面对大型场景的3D渲染中,RTX 3080毫无疑问同样会遇到“爆显存”的问题,而使用RTX3090则可以完全规避这个问题,带来更为强劲的渲染性能。
DaVinci Resolve 16的视频工作流程中,使用RTX 3090时,我们可以看到其可以流畅地实时播放8KRAW(R3D)格式视频,再为该视频添加一个时域降噪效果,并将MotionBlur(运动模糊)设置为50。此时的显存占用已经接近了13GB,RTX 3090可以轻松完成,但巨大的显存占用超出了RTX 3080的处理能力,使用时会导致报错。
在8K游戏中,大部分3A游戏大作的显存占用已经超过了10GB,在使用RTX 3080时,会出现“爆显存”帧速骤降、无法选择画面设置、无法设置8K分辨率等问题,从而造成无法正常游戏,而RTX 3090则完全不用担心显存的问题。
“我迫不及待地想前进 20 年,看看 RTX 打开了一个怎样的世界。”黄仁勋在RTX30系列发布会结尾这样展望。
“我们迫不及待的想进入测试,看看RTX 3090这个性能怪兽会有怎样强悍的性能体验。”做测试的小狮子这样说道(由于FE版RTX 3090不在国内发售,所以本次首发评测直接选用AIC的非公版产品)。
DLSS超高性能模式助阵,“BFGPU”挑战8K游戏
对于本次的NVIDIA GeForce RTX 3090,老黄(NVIDIA CEO黄仁勋)在发布会上创造了一个词“BFGPU”( a Big Ferocious GPU)来专门形容它,直译为“一個大且凶猛的GPU”,从字面意思也能看出NVIDIA对其的期望。
它瞄准的不再是4K/60fps这个目标,而是更远大的理想——8K/60fps,16倍于1080P的计算量、4倍于4K的计算量。当然,8K/60fps是在全新的DLSS(深度学习超级采样)技术下完成的,并非原生8K输出。而DLSS技术,也被老黄称为近十年来最大的突破。
在2013年,NVIDIA发布了第一款TITAN GPU,在过去的数年中,TITAN系列产品都只以公版的形式限量发售。而显存容量则是TITAN系列产品的定义特征之一,TITAN系列提供的显存容量比同时代的GeForce系列游戏显卡更大,让人工智能、AI深度学习等相关从业者拥有处理更大数据量的能力。随着用户对具有大显存容量TITAN系列产品需求的增多,NVIDIA也在本次RTX 3090上直接下放了显存规格,能够同时满足创意工作者和8K游戏在显存方面的巨大需求。
为了实现这个宏远的目标,NVIDIA GeForce RTX 3090的规格自然也是十分的强大。其配备了GA102-300 GPU核心,比RTX 3080上搭载的GA102-200更加完整,拥有10496个CUDA核心,328个第三代AI人工智能核心TENSOR Core,82个第二代光线追踪核心,配备了24GB GDDR6X显存,384bit 位宽,最大带宽为936Gbps。GPU核心频率1.70GHz ,实现了35.6 TFLOPs的性能,可以应对最具挑战性的人工智能算法,并满足大规模内容创作的需求。
NVIDIA GeForce RTX 3090也是世界上第一款能够支持8K HDR游戏的显卡,可在RTX开启、DLSS 8K和HDR Shadowplay功能下运行8K游戏,帧率能达到60fps,相比于Titan RTX快了50%。所以无论是从发展史、规格上来说,RTX 3090都是一块定位于TITAIN级的位于性能巅峰的GPU。当然,从价格来说,它和上代RTX 2080 Ti的定价基本持平。GeForce RTX 3090能够同时满足精英创作者的高负载工作场景和追逐游戏性能巅峰的游戏玩家。
关于NVIDIA RTX 30系列的整体提升和黑科技在之前RTX 3080的首发测试中我们已经进行过详细的分析,这里就不再赘述,只针对RTX 3090比较独特的点进行详细的分析。
由于8K数据流的需求更为庞大,目前的HDMI 2.0b和DP1.4a均无法实现单条数据线传输8K/60fps/HDR数据流(HDMI2.0需要4条数据线),而HDMI2.1则可以很好地解决这一问题。GeForce RTX 3090是首批支持 HDMI 2.1 的 GPU,也是目前第一批能在8K HDR电视上支持HDMI2.1单条数据线输出的GPU之一,极大地简化了连接。
当然,即使解决了传输问题,想要实现以8K/60fps指标流畅运行3A游戏大作,依旧对GPU是一个极大的考验,毕竟每秒GPU需要绘制的图像像素量已经达到了4K的4倍,这显然已经超出当代GPU规格能够完成的事情。所以针对8K游戏来说,NVIDIA引入了全新的DLSS超高性能图像质量模式,在原有的基础上,提供了9倍AI超分辨率缩放,可以将1440P(2K)AI缩放至8K,从而实现8K/60fps流畅游戏。同时,在新版的GeForce Experience软件中,玩家还可以通过RTX 30系显卡的8K HDR 30 fps录制功能,直接录制8K视频,而不再需要使用高价的采集卡来采集游戏画面。
除了实现游戏方面对8K分辨率的优化,RTX 3090还是首批支持硬件加速的AV1解码以实现流畅8K 60 fps播放的GPU之一,与现有的H.264、H.265(HEVC)、VP9解码器相比,效率更高。AV1将播放高分辨率视频所需的带宽降低了多达50%(通常H264进行8K播放至少需要140 Mbps的带宽),使其成为下一代4K和8K HDR在线视频的理想选择。
另外,NVIDIA RTX 30系列目前只有RTX 3090搭载了新一代NVLink接口,且只支持2 WayNVLink,玩家们谈了多年的“四路泰坦抱回家”的梗就此终结了。
24GB大显存用处何在?生产力与8K游戏实测
NVIDIA RTX 3090的24GB GDDR6X大显存在生产力和游戏方面具体体现了哪些优势呢?下面我们通过几个简单的测试来一起看看。
在OctaneRender渲染器的Demo独立版中,我们载入一个4GB左右的场景文件并进行渲染。RTX3090仅使用37秒就完成了渲染,显存占用了13954MB,没有使用系统内存进行核心外渲染。
轉而使用RTX 3080进行同一个场景的渲染就会发现,OctaneRender渲染器会提示调用系统内存进行了核心外渲染,从而导致渲染时间大幅延长。渲染结束后我们可以从性能指示器看到,RTX 3080使用了7055MB显存,同时调用了6899MB系统内存,而整个渲染过程长达545秒。
很显然,在面对大型场景的3D渲染中,RTX 3080毫无疑问同样会遇到“爆显存”的问题,而使用RTX3090则可以完全规避这个问题,带来更为强劲的渲染性能。
DaVinci Resolve 16的视频工作流程中,使用RTX 3090时,我们可以看到其可以流畅地实时播放8KRAW(R3D)格式视频,再为该视频添加一个时域降噪效果,并将MotionBlur(运动模糊)设置为50。此时的显存占用已经接近了13GB,RTX 3090可以轻松完成,但巨大的显存占用超出了RTX 3080的处理能力,使用时会导致报错。
在8K游戏中,大部分3A游戏大作的显存占用已经超过了10GB,在使用RTX 3080时,会出现“爆显存”帧速骤降、无法选择画面设置、无法设置8K分辨率等问题,从而造成无法正常游戏,而RTX 3090则完全不用担心显存的问题。
“我迫不及待地想前进 20 年,看看 RTX 打开了一个怎样的世界。”黄仁勋在RTX30系列发布会结尾这样展望。
“我们迫不及待的想进入测试,看看RTX 3090这个性能怪兽会有怎样强悍的性能体验。”做测试的小狮子这样说道(由于FE版RTX 3090不在国内发售,所以本次首发评测直接选用AIC的非公版产品)。