论文部分内容阅读
在进行实测对比之前,我们不妨先通过NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列显卡的规格参数来对比它们的“理论战力值”。NVIDIA GeForce RTX 30系列显卡(下文简称RTX 30系列显卡)基于目前最新的NVIDIA Ampere架构,该架构采用改进的Streaming Multiprocessor(下文简称SM) ,它由不同核心、单元以及内存构成。NVIDIA Ampere架构SM的一大变化是FP32操作的吞吐量变为两倍。为实现这一目标,新数据路径设计是每个SM分区每时钟能够执行32个F P32操作,所有四个S M分区组合在一起,每个时钟可执行128F P32操作。这能带来什么好处呢?简单来说,图形、计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。
和RTX 20系列显卡相比,RTX 30系列显卡的RT Core和Tensor Core均进行了增强。其中,RTX 30系列显卡搭载的是第二代RT Core。NVIDIA的数据表明,第二代RT Core的性能达到上一代的两倍左右,同时其运动模糊渲染效率更是达到上一代RT Core的8倍。
在GPU上引入Tensor Core(中文名为“张量核心”)是NVI DI A近年来的一大创举。RTX 30系列显卡上搭载的是第三代Tensor Core,其主要特点是支持更多的数据格式,大幅度加强了在稀疏矩阵计算时的效能。比如在原始矩阵具有稀疏性时,第三代Tensor Core的速度可达到第一代的20倍等。而在实际游戏中,第三代Tensor Core提供的就是玩家熟悉的NVIDIA DLSS功能,其主要作用是在游戏中有效遏制帧率下降,同时还能提供优秀的画质表现。目前,NV IDI A DLSS已经更新至2.1版本,并在游戏中提供了质量、平衡、性能和超性能这4种模式供玩家选择。
此外,引入光线追踪动态模糊加速也是基于NVIDIA Ampere架构的第二代RT Core上一个重要的技术创新。动态模糊是一种非常流行且重要的计算机图形效果,它可用于游戏、电影以及许多专业渲染应用程序中。从原理上来讲,动态模糊的本质和胶片摄影相关,因为胶片摄影时,图像不是立即创建的,而是通过将胶片在有限的时间段内曝光来创建的。这意味着目标物体在胶片快门时间内的高速移动将带来模糊的曝光效果。如果G P U想要创建类似效果,必须模拟相机和胶片工作流程。动态模糊对于电影是非常重要的,它能够避免画面出现断续卡顿的情况,對游戏来说亦是如此。
AMD Radeon RX 6000系列(下文简称RX 6000系列)显卡是AMD第一代支持硬件光线追踪渲染的产品。该系列显卡基于AMD最新推出的RDNA 2架构,并通过引入硬件光线追踪单元(下文简称:RA单元)以实现对硬件光线追踪渲染的支持。目前的资料显示,RDNA 2架构的每个CU单元配备1个RA单元,同时AMD宣称RA单元的光线追踪交叉性能是传统软件执行的10倍。数据显示,RDNA2架构的GPU在微软DXR SDK的Procedural Geometry的测试中带来了471fps的成绩,在软件模拟下只有34f p s,因此性能达到了软件的13.8倍。实际上Procedural Geometry只是整个DXR SDK中的一部分,用于测试地面以上所有对象在光线追踪上的性能,其图元信息包括解析几何、体积几何和带符号的距离几何等多重内容。
从技术层面来看,RTX30系列显卡和RX6000系列显卡均在硬件层面支持实时光线追踪渲染,但考虑到RTX 30系列显卡还得到第三代Tensor Core的加持,它可以大幅提升游戏帧率,所以我们认为RTX30系列显卡在光追游戏中开启DLSS之后的游戏性能应该更加出色。那么实际情况如何呢?下面我们就在游戏实测中一探究竟。
光追性能对比测试
参与本次测试的显卡是来自NVIDIA的GeForce RTX 3080、GeForceRTX 3070、GeForce RTX 3060 Ti(下文分别简称RT X 3080、RT X 3070、RTX 3060 Ti),以及它们各自的对位显卡—AMD Radeon RX 6800XT、Radeon RX 6800、Radeon RX 6700XT(下文分别简称R X 6 8 0 0 X T、R X6800、R X 6700X T)。同时,我们还为这些参测显卡搭配了以A M D锐龙9 5950X处理器、ROG CROSSHAIR ⅧDARK HERO主板、DDR4 3200 32GB双通道内存为核心的测试平台。
测试游戏的选择上,《赛博朋克2077》这款时下火爆的光追游戏自然不可或缺,同时我们还挑选了包含《堡垒之夜》《我的世界》《控制》等共计8款光追游戏参与测试。考虑到来自NVIDIA的3款RTX 30系列显卡还支持DLSS技术,所以我们在测试中将分别测试这3款显卡在“光追:开 DLSS:关”,以及“光追:开 DLSS:开”设定下的性能。游戏设置方面,所有参测游戏的光线追踪等级将设为最高,同时部分参测游戏支持多种DLSS模式,我们在本次测试中统一选择平衡模式。需要说明的是,由于RTX 3080、RTX 3070、RTX 3060 Ti在1080p分辨率下运行《古墓丽影:暗影》和《地铁:离去》时不支持开启DLSS,所以在这两款游戏中,我们不考察这3款显卡在1080p分辨率下同时开启光线追踪和DLSS的性能。
测试成绩解析部分,我们将首先对比参测显卡在开启光线追踪,并关闭DLSS时的游戏性能。随后我们还会把RTX 3080、RTX 3070、RTX 3060Ti在同时开启光线追踪和D L S S之后的游戏性能,分别与R X 6800X T、R X6800、RX 6700XT进行对比。 首先在开启光线追踪,并关闭DLSS时,参测3款RTX 30系列显卡大获全胜。例如在2.5K分辨率和最高画质下,RTX 3080运行《控制》的平均帧率达到72fps,而其对位显卡R X6800XT的平均帧率仅有49fps,后者的测试成绩不仅落后RTX 3080约47%,同时还远低于60fps这一绝对流畅基准线。可以预见的是,在一些光线追踪环境较为复杂,或者玩家与敌人进行激烈对抗的过程中,RX 6800XT在2.5K分辨率和最高画质下很难给玩家提供足够流畅的光追体验。不仅如此,分别在1080p、2.5K和4K下运行《我的世界》时,RT X 3080和RT X3060 Ti测得的平均帧率都达到其对位显卡RX 6800XT和RX 6700XT的两倍或更高。同时相比RX 6800,RTX 3070在上述3种分辨率下运行《我的世界》的平均帧率也都高出85%以上。
下面我们再来看看开启DLSS之后,参测3款RT X 30系列显卡的光追游戏性能。测试成绩显示,相比关闭DLSS时,這3款RTX 30系列显卡在开启DLSS之后的性能提升非常大。例如关闭DLSS时,RTX 3080在4K分辨率和最高画质下运行《我的世界》的平衡帧率为34fps,而当开启DLSS之后,其平均帧率提升180%,达到95fps。不仅如此,和6800XT、RX 6800、RX 6700XT这3款显卡相比,参测3款RTX 30系列显卡开启D LSS之后的光追性能领先非常多。同样以《我的世界》为例,RX 6700XT在4K分辨率和最高画质下运行这款游戏的平均帧率为10fps,而其对位显卡RTX 3060 Ti在相同设定下运行《我的世界》的平均帧率高达60fps,是前者的6倍。
RTX 30系列显卡,光追游戏玩家的不二之选
综合我们的测试成绩不难看出,RTX 3080、RTX 3070、RTX 3060 Ti在8款参测游戏中的光追性能完全碾压各自的对位显卡。不仅如此,即使RTX 3060Ti的定位比RX 6800XT更低一些,但在开启DLSS之后,其光追游戏性能也能在不同程度上领先RX 6800XT,可见在DLSS的加持下,RTX 30系列显卡的光追游戏性能的确更加亮眼。因此我们认为,对于想要享受畅爽光追游戏体验的玩家来说,RTX 30系列显卡就是你们的不二之选。
和RTX 20系列显卡相比,RTX 30系列显卡的RT Core和Tensor Core均进行了增强。其中,RTX 30系列显卡搭载的是第二代RT Core。NVIDIA的数据表明,第二代RT Core的性能达到上一代的两倍左右,同时其运动模糊渲染效率更是达到上一代RT Core的8倍。
在GPU上引入Tensor Core(中文名为“张量核心”)是NVI DI A近年来的一大创举。RTX 30系列显卡上搭载的是第三代Tensor Core,其主要特点是支持更多的数据格式,大幅度加强了在稀疏矩阵计算时的效能。比如在原始矩阵具有稀疏性时,第三代Tensor Core的速度可达到第一代的20倍等。而在实际游戏中,第三代Tensor Core提供的就是玩家熟悉的NVIDIA DLSS功能,其主要作用是在游戏中有效遏制帧率下降,同时还能提供优秀的画质表现。目前,NV IDI A DLSS已经更新至2.1版本,并在游戏中提供了质量、平衡、性能和超性能这4种模式供玩家选择。
此外,引入光线追踪动态模糊加速也是基于NVIDIA Ampere架构的第二代RT Core上一个重要的技术创新。动态模糊是一种非常流行且重要的计算机图形效果,它可用于游戏、电影以及许多专业渲染应用程序中。从原理上来讲,动态模糊的本质和胶片摄影相关,因为胶片摄影时,图像不是立即创建的,而是通过将胶片在有限的时间段内曝光来创建的。这意味着目标物体在胶片快门时间内的高速移动将带来模糊的曝光效果。如果G P U想要创建类似效果,必须模拟相机和胶片工作流程。动态模糊对于电影是非常重要的,它能够避免画面出现断续卡顿的情况,對游戏来说亦是如此。
AMD Radeon RX 6000系列(下文简称RX 6000系列)显卡是AMD第一代支持硬件光线追踪渲染的产品。该系列显卡基于AMD最新推出的RDNA 2架构,并通过引入硬件光线追踪单元(下文简称:RA单元)以实现对硬件光线追踪渲染的支持。目前的资料显示,RDNA 2架构的每个CU单元配备1个RA单元,同时AMD宣称RA单元的光线追踪交叉性能是传统软件执行的10倍。数据显示,RDNA2架构的GPU在微软DXR SDK的Procedural Geometry的测试中带来了471fps的成绩,在软件模拟下只有34f p s,因此性能达到了软件的13.8倍。实际上Procedural Geometry只是整个DXR SDK中的一部分,用于测试地面以上所有对象在光线追踪上的性能,其图元信息包括解析几何、体积几何和带符号的距离几何等多重内容。
从技术层面来看,RTX30系列显卡和RX6000系列显卡均在硬件层面支持实时光线追踪渲染,但考虑到RTX 30系列显卡还得到第三代Tensor Core的加持,它可以大幅提升游戏帧率,所以我们认为RTX30系列显卡在光追游戏中开启DLSS之后的游戏性能应该更加出色。那么实际情况如何呢?下面我们就在游戏实测中一探究竟。
光追性能对比测试
参与本次测试的显卡是来自NVIDIA的GeForce RTX 3080、GeForceRTX 3070、GeForce RTX 3060 Ti(下文分别简称RT X 3080、RT X 3070、RTX 3060 Ti),以及它们各自的对位显卡—AMD Radeon RX 6800XT、Radeon RX 6800、Radeon RX 6700XT(下文分别简称R X 6 8 0 0 X T、R X6800、R X 6700X T)。同时,我们还为这些参测显卡搭配了以A M D锐龙9 5950X处理器、ROG CROSSHAIR ⅧDARK HERO主板、DDR4 3200 32GB双通道内存为核心的测试平台。
测试游戏的选择上,《赛博朋克2077》这款时下火爆的光追游戏自然不可或缺,同时我们还挑选了包含《堡垒之夜》《我的世界》《控制》等共计8款光追游戏参与测试。考虑到来自NVIDIA的3款RTX 30系列显卡还支持DLSS技术,所以我们在测试中将分别测试这3款显卡在“光追:开 DLSS:关”,以及“光追:开 DLSS:开”设定下的性能。游戏设置方面,所有参测游戏的光线追踪等级将设为最高,同时部分参测游戏支持多种DLSS模式,我们在本次测试中统一选择平衡模式。需要说明的是,由于RTX 3080、RTX 3070、RTX 3060 Ti在1080p分辨率下运行《古墓丽影:暗影》和《地铁:离去》时不支持开启DLSS,所以在这两款游戏中,我们不考察这3款显卡在1080p分辨率下同时开启光线追踪和DLSS的性能。
测试成绩解析部分,我们将首先对比参测显卡在开启光线追踪,并关闭DLSS时的游戏性能。随后我们还会把RTX 3080、RTX 3070、RTX 3060Ti在同时开启光线追踪和D L S S之后的游戏性能,分别与R X 6800X T、R X6800、RX 6700XT进行对比。 首先在开启光线追踪,并关闭DLSS时,参测3款RTX 30系列显卡大获全胜。例如在2.5K分辨率和最高画质下,RTX 3080运行《控制》的平均帧率达到72fps,而其对位显卡R X6800XT的平均帧率仅有49fps,后者的测试成绩不仅落后RTX 3080约47%,同时还远低于60fps这一绝对流畅基准线。可以预见的是,在一些光线追踪环境较为复杂,或者玩家与敌人进行激烈对抗的过程中,RX 6800XT在2.5K分辨率和最高画质下很难给玩家提供足够流畅的光追体验。不仅如此,分别在1080p、2.5K和4K下运行《我的世界》时,RT X 3080和RT X3060 Ti测得的平均帧率都达到其对位显卡RX 6800XT和RX 6700XT的两倍或更高。同时相比RX 6800,RTX 3070在上述3种分辨率下运行《我的世界》的平均帧率也都高出85%以上。
下面我们再来看看开启DLSS之后,参测3款RT X 30系列显卡的光追游戏性能。测试成绩显示,相比关闭DLSS时,這3款RTX 30系列显卡在开启DLSS之后的性能提升非常大。例如关闭DLSS时,RTX 3080在4K分辨率和最高画质下运行《我的世界》的平衡帧率为34fps,而当开启DLSS之后,其平均帧率提升180%,达到95fps。不仅如此,和6800XT、RX 6800、RX 6700XT这3款显卡相比,参测3款RTX 30系列显卡开启D LSS之后的光追性能领先非常多。同样以《我的世界》为例,RX 6700XT在4K分辨率和最高画质下运行这款游戏的平均帧率为10fps,而其对位显卡RTX 3060 Ti在相同设定下运行《我的世界》的平均帧率高达60fps,是前者的6倍。
RTX 30系列显卡,光追游戏玩家的不二之选
综合我们的测试成绩不难看出,RTX 3080、RTX 3070、RTX 3060 Ti在8款参测游戏中的光追性能完全碾压各自的对位显卡。不仅如此,即使RTX 3060Ti的定位比RX 6800XT更低一些,但在开启DLSS之后,其光追游戏性能也能在不同程度上领先RX 6800XT,可见在DLSS的加持下,RTX 30系列显卡的光追游戏性能的确更加亮眼。因此我们认为,对于想要享受畅爽光追游戏体验的玩家来说,RTX 30系列显卡就是你们的不二之选。