论文部分内容阅读
曾几何时,我们终日讨论显卡性能为何无法满足游戏的需求。然而在DirectX 10显卡快速更迭的今天,显卡性能过剩论又俨然出现在我们面前——机箱里面安装有功耗超过一百瓦的显卡,大部分情况下却不过是在待机或者处理最简单的2D操作。难道显卡就只是游戏的附属硬件?答案绝对是否定的,因为所有显卡厂商都在不约而同地告诉我们:在未来,显卡理应做得更多。
从GPGPU到CUDA,显卡还能做的更多
其实早在GeForce FX时代就有许多研究机构开始就GPU的可编程性进行试验,在当时DirectX 9 API就首次实现了顶点着色器和像素着色器的可编程性,让程序员可以通过Shader程序,实现任何想要的画面效果。在当时就有人提出如果将输入GPU的数据由图像换成其它,能否让GPU实现更多的应用?
当GPU进入DirectX 10时代以后,统一渲染架构在编程灵活性上获得了进一步的提升——顶点着色其和像素着色器被统一到了Streaming Processor(流处理器)内部,这样的变革不仅解放了游戏开发者,还给通用计算引来了新的曙光。NVIDIA的CUDA(ComputeUnified Device Architecture,统一计算设备架构)就在这样的形势下被提出。
和以往单独构建硬件抽象层并且使用专用程序语言的GPU不同,NVIDIA的CUDA选择了更为务实的做法。我们可以把CUDA简单的看做是专为NVIDIA GPU设计的C语言开发环境。和以往的GPGPU需要程序员自行开发“迂回”的实现架构不同,CUDA在问世初期就拥有了完整直接的开发程序。NVIDIA给开发者提供的CUDA套件包括了nvcc C语言编译器、适用于GPU的CUDA FFT和BLAS库、CUDA分析器、GDB调试器以及CUDA运行时的驱动程序。除此以外,CUDA还拥有详尽的编程指南和大量范例供开发者参考。
在CUDA的帮助下,开发者只需要专注于自己所开发的应用,剩下的GPU实现部分将由NVIDIA的编译器自行完成,完全无需像普通GPGPU应用那样针对每一款显卡设计各种复杂的算法。在NVIDIA的帮助下,CUDA迅速获得了大量业界厂商的支持。在CUDA问世不到一年时间内,许多应用程序就已经支持了这一标准,依靠GPU获得远比CPU强大得多的运行速度。NVIDIA CUDA的不断普及,使我们深刻体验到了GPU所隐藏的惊人运算能力。究竟在桌面应用中GPU能为我们多做些啥?接下来就让我们一起探究。
通用有多快?CUDA实战
Adobe Acrobat
自从Adobe Acrobat生成的PDF格式文档成为世界文档交换标准,获得各大机构广泛采用以后,许多人都认为PDF打开文档的速度过于缓慢。如果你的文档中还包含大量的图片和3D对象,那打开时计算机陷入假死状态的情况几乎不可避免。
为了解决PDF文档打开、编辑速度的问题,Adobe在2007年推出的Acrobat 8和Adobe Reader 8中加入了GPU加速功能和对NVIDIA CUDA架构的支持。我们只需要在Acrobat软件中选择编辑、设定栏目,就能在页面显示设置中找到使用2D图形加速选项。在点选这个选项后,Acrobat打开文档将会借助图形卡的处理能力,让整个打开过程变得极为迅速。在拖动复杂页面的时候,Acrobat也能保持流畅的速度,大幅提升了PDF文档的编辑和查看效率。
在Adobe将其下的Acrobat升级到9.0后,新的软件更可以在处理内嵌3D对象和多媒体内容的时候,直接通过CUDA调用GPU资源,实现PDF文档内部的视频加速和3D图像渲染。这样的改进对于经常使用PDF格式作为交换文档的用户来说,有着极为重要的意义。
Cooliris图片浏览(PicLens)
除了打开PDF文档可以在CUDA的加速下瞬间搞定之外,在浏览网页和图片的时候,CUDA也照样能大显身手。一个叫做Pic Lens的插件可以让我们快速浏览各种照片和视频,并且拥有极为科幻漂亮的外观。在完全支持CUDA之后,PicLens改名叫做Cooliris,可以让我们以3D的形式浏览图片。这款软件支持Firefox、 Internet Explorer及Safari等常用浏览器,借助G P U的运算能力,对Facebook、 Flickr、 Goggle、Picasa、 Yahoo、 Youtube等应用创建出3D视觉搜寻接口。
Cooliris有如“未来报告”般的操作接口,实时做出一道立体墙 (3DWall) ,将搜寻结果展现于3D空间内。用户还还可使用鼠标控制移动方向,实现无缝转页,并容许随时放大、缩小图片或播放影片,使搜寻更方便快捷、更见乐趣。
Adobe Flash Player
在富媒体应用时代*,每当我们打开一些大型网站,都会因为FLASH过多而出现“卡壳”的现象。在同时打开多个Youtube等视频点播窗口时,CPU占用率大幅提升似乎也是不可避免的。事实上,在CUDA的帮忙下,打开充满FLASH的网页也照样运转如飞。
* 注释:富媒体应用即RichMedia。这种应用就是采取所有可能采取的最先进技术来传达信息以及与用户进行互动。FLASH、带有视频的Web应用都可以叫做富媒体。
在Adobe FLASH Player 10及其浏览器插件中,已经加入了对GPU加速的支持。我们只需要打开任何一个使用FLASH的网站,在FLASH上点击右键然后选择设置,我们就可以看到硬件加速选项。
根据Adobe的规划,新一代FLASHPlayer 10插件除了提供常规的FLASHCUDA加速之外,还将提供H.264视频的硬件解码加速支持。这样我们在看高质量Youtube视频的时候,就完全无须担心CPU占用率过高等问题。
TMPGEnc 4.0 Xpress视频转换
一直以来用电脑进行各种视频格式的转换都是件费时费力的事情,进入高清时代,视频编码格式转换的时间更是大幅增加。如今使用4内核处理器配合H.264编码器压缩一段视频,速度只有0.3FPS——这意味着完成一部电影的压缩,所耗费的时间将会是电影播放长度3倍以上。而在我们的数字生活中,却经常需要把各种格式的视频转换放入iPod、PSP甚至是MP4中。
既然我们可以通过GPU实现硬件高清视频解码,那能否用GPU来完成硬件高清视频编码?在CUDA的帮助下,业界著名编码器TMPGEnC 4.0终于实现了G P U硬件加速编码。在TMPGEnC 4.0上,通过CUDA,软件可以借助GPU来完成视频过滤等操作, 在打开GPU硬件加速后编码器可以获得446%的编码速度提升,极大地减少了视频转换所耗费的时间。
实际体验
对于游戏玩家来说最切身的体验毫无疑问是PhysX物理加速,而对音视频玩家,新的显卡强大的CUDA引擎以及对H.264和VC-1的硬解码能力无疑让人惊喜,那它们究竟会带了多大的性能提升呢?也许通过两个新旧平台的测试就可以一目了然。
点评:显卡我们选用了能够支持PhysX物理加速的G9600GT游戏高手全能版。这是盈通推出的一款超频板GeFo r c e 9600 GT显卡,除采用了强大的风冷热管散热器之外,该显卡默认核心/显存频率高达700MHz /2200MHz,远高于公版GeFor c e 9600 GT,是目前超频版GeFor c e 9600 GT显卡中频率最高的一款,整体性能提升明显。此外,它还采用了双BIOS设计,用户可以通过显卡挡板上一个开关轻松实现BIOS的切换。丰富的接口也是这款产品的一大特色。它提供了包括DVI、HDMI、VGA、Displayport、S-Vedio以及SPDIF IN在内众多接口,为用户的音视频连接提供了强大的支持。
PhysX物理加速
我们对比了安装物理驱动前后GeForce 9600 GT显卡的3DMar kVantage成绩,发现改进后的物理驱动对显卡的3D性能已经很明显了,对GeForce 9600 GT而言,提升了1200左右,幅度达到了26%。安装物理驱动之后,原来由CPU负责完成的物理运算现在交由GPU来完成,体现在成绩上,可以发现3DMark Vantage CPU2子项成绩得以成倍提升,由原来的7.27变成了现在的93.51,换算到CPU成绩上,你会发现CPU 3DMark Vantage成绩猛涨到了22174分。
更高的游戏运行速度
通过对《GR AW 2》、《虚幻竞技场3》、《Nurien》以及《The GreatK u l u》等游戏试玩之后发现,游戏中粒子加速、光影转换、爆炸场面、烟尘处理等方面处理相比之前感觉更加真实。比如在《Ru nwa y》的一个场景中,Nurien在许多地方都利用了PhysX物理加速技术,因此能够带给玩家无与伦比的真实体验:发丝的飘逸更加自然,完全没有以前生硬的感觉;衣服的褶皱效果真实,并随舞者的身形自然改变,舞台上的喷雾效果也有一种让人身临其境的感觉……。而爆炸的真实特效在《虚幻竞技场3》中体验得更加明显。泥石飞溅、玻璃破碎、天花板掉落、炸弹爆炸以及子弹的飞行轨迹等效果,感觉更加震撼。
除了为您带来极富视觉冲击力的物理效果外,强大的GPU处理能力加上PhysX物理加速,也极大地提升了游戏的帧数。相对于普通PC平台,在《GRAW 2》和《虚幻竞技场3》中,优化PC的性能遥遥领先,差距非常明显。
音视频转换速度大大加快
目前高清影片越来越多,转换视频格式将成为一个热门话题。优化PC借助NVIDIA CUDA的功能和相关软件(《BadaBoom》),带来了更高的视频转换速度,耗时大大缩短,有时速度会提升近600%,为用户节约了大量的时间。
赋予了PC更强的计算能力
在科学计算中,G P U也开始展现强大的实力。除了对比的Folding@H ome外,在P D F加速,C A D计算加速,Matlab计算加速上,借助CUDA,GeForce 9600 GT GPU都展现了极为惊人的力量。可以看到在Matlab复杂的科学计算中,优化PC的速度比普通PC快了将近400%。
强大的高清视频解码能力
在高清视频解码方面,由于内置H.264和VC-1解码引擎,优化PC的CPU占用率大大降低,即使在播放1080p格式的高清视频时,CPU占用率也只有10%左右。
结语
在3D世界日益真实的今天,显卡又将涉足的领域延伸到了通用计算。在不久的将来,我们快速打开大量网页、文档,进行复杂的高清视频格式转换都将离不开GPU的帮助,显卡也将会在机箱内部占据越来越重要的地位。现在NVIDIA的CUDA为我们带来了以往不敢想象的运算能力,大幅提升了现有PC的性能,而这一切仅仅只是开端,优化PC的曙光就在眼前。
从GPGPU到CUDA,显卡还能做的更多
其实早在GeForce FX时代就有许多研究机构开始就GPU的可编程性进行试验,在当时DirectX 9 API就首次实现了顶点着色器和像素着色器的可编程性,让程序员可以通过Shader程序,实现任何想要的画面效果。在当时就有人提出如果将输入GPU的数据由图像换成其它,能否让GPU实现更多的应用?
当GPU进入DirectX 10时代以后,统一渲染架构在编程灵活性上获得了进一步的提升——顶点着色其和像素着色器被统一到了Streaming Processor(流处理器)内部,这样的变革不仅解放了游戏开发者,还给通用计算引来了新的曙光。NVIDIA的CUDA(ComputeUnified Device Architecture,统一计算设备架构)就在这样的形势下被提出。
和以往单独构建硬件抽象层并且使用专用程序语言的GPU不同,NVIDIA的CUDA选择了更为务实的做法。我们可以把CUDA简单的看做是专为NVIDIA GPU设计的C语言开发环境。和以往的GPGPU需要程序员自行开发“迂回”的实现架构不同,CUDA在问世初期就拥有了完整直接的开发程序。NVIDIA给开发者提供的CUDA套件包括了nvcc C语言编译器、适用于GPU的CUDA FFT和BLAS库、CUDA分析器、GDB调试器以及CUDA运行时的驱动程序。除此以外,CUDA还拥有详尽的编程指南和大量范例供开发者参考。
在CUDA的帮助下,开发者只需要专注于自己所开发的应用,剩下的GPU实现部分将由NVIDIA的编译器自行完成,完全无需像普通GPGPU应用那样针对每一款显卡设计各种复杂的算法。在NVIDIA的帮助下,CUDA迅速获得了大量业界厂商的支持。在CUDA问世不到一年时间内,许多应用程序就已经支持了这一标准,依靠GPU获得远比CPU强大得多的运行速度。NVIDIA CUDA的不断普及,使我们深刻体验到了GPU所隐藏的惊人运算能力。究竟在桌面应用中GPU能为我们多做些啥?接下来就让我们一起探究。
通用有多快?CUDA实战
Adobe Acrobat
自从Adobe Acrobat生成的PDF格式文档成为世界文档交换标准,获得各大机构广泛采用以后,许多人都认为PDF打开文档的速度过于缓慢。如果你的文档中还包含大量的图片和3D对象,那打开时计算机陷入假死状态的情况几乎不可避免。
为了解决PDF文档打开、编辑速度的问题,Adobe在2007年推出的Acrobat 8和Adobe Reader 8中加入了GPU加速功能和对NVIDIA CUDA架构的支持。我们只需要在Acrobat软件中选择编辑、设定栏目,就能在页面显示设置中找到使用2D图形加速选项。在点选这个选项后,Acrobat打开文档将会借助图形卡的处理能力,让整个打开过程变得极为迅速。在拖动复杂页面的时候,Acrobat也能保持流畅的速度,大幅提升了PDF文档的编辑和查看效率。
在Adobe将其下的Acrobat升级到9.0后,新的软件更可以在处理内嵌3D对象和多媒体内容的时候,直接通过CUDA调用GPU资源,实现PDF文档内部的视频加速和3D图像渲染。这样的改进对于经常使用PDF格式作为交换文档的用户来说,有着极为重要的意义。
Cooliris图片浏览(PicLens)
除了打开PDF文档可以在CUDA的加速下瞬间搞定之外,在浏览网页和图片的时候,CUDA也照样能大显身手。一个叫做Pic Lens的插件可以让我们快速浏览各种照片和视频,并且拥有极为科幻漂亮的外观。在完全支持CUDA之后,PicLens改名叫做Cooliris,可以让我们以3D的形式浏览图片。这款软件支持Firefox、 Internet Explorer及Safari等常用浏览器,借助G P U的运算能力,对Facebook、 Flickr、 Goggle、Picasa、 Yahoo、 Youtube等应用创建出3D视觉搜寻接口。
Cooliris有如“未来报告”般的操作接口,实时做出一道立体墙 (3DWall) ,将搜寻结果展现于3D空间内。用户还还可使用鼠标控制移动方向,实现无缝转页,并容许随时放大、缩小图片或播放影片,使搜寻更方便快捷、更见乐趣。
Adobe Flash Player
在富媒体应用时代*,每当我们打开一些大型网站,都会因为FLASH过多而出现“卡壳”的现象。在同时打开多个Youtube等视频点播窗口时,CPU占用率大幅提升似乎也是不可避免的。事实上,在CUDA的帮忙下,打开充满FLASH的网页也照样运转如飞。
* 注释:富媒体应用即RichMedia。这种应用就是采取所有可能采取的最先进技术来传达信息以及与用户进行互动。FLASH、带有视频的Web应用都可以叫做富媒体。
在Adobe FLASH Player 10及其浏览器插件中,已经加入了对GPU加速的支持。我们只需要打开任何一个使用FLASH的网站,在FLASH上点击右键然后选择设置,我们就可以看到硬件加速选项。
根据Adobe的规划,新一代FLASHPlayer 10插件除了提供常规的FLASHCUDA加速之外,还将提供H.264视频的硬件解码加速支持。这样我们在看高质量Youtube视频的时候,就完全无须担心CPU占用率过高等问题。
TMPGEnc 4.0 Xpress视频转换

一直以来用电脑进行各种视频格式的转换都是件费时费力的事情,进入高清时代,视频编码格式转换的时间更是大幅增加。如今使用4内核处理器配合H.264编码器压缩一段视频,速度只有0.3FPS——这意味着完成一部电影的压缩,所耗费的时间将会是电影播放长度3倍以上。而在我们的数字生活中,却经常需要把各种格式的视频转换放入iPod、PSP甚至是MP4中。
既然我们可以通过GPU实现硬件高清视频解码,那能否用GPU来完成硬件高清视频编码?在CUDA的帮助下,业界著名编码器TMPGEnC 4.0终于实现了G P U硬件加速编码。在TMPGEnC 4.0上,通过CUDA,软件可以借助GPU来完成视频过滤等操作, 在打开GPU硬件加速后编码器可以获得446%的编码速度提升,极大地减少了视频转换所耗费的时间。
实际体验
对于游戏玩家来说最切身的体验毫无疑问是PhysX物理加速,而对音视频玩家,新的显卡强大的CUDA引擎以及对H.264和VC-1的硬解码能力无疑让人惊喜,那它们究竟会带了多大的性能提升呢?也许通过两个新旧平台的测试就可以一目了然。
点评:显卡我们选用了能够支持PhysX物理加速的G9600GT游戏高手全能版。这是盈通推出的一款超频板GeFo r c e 9600 GT显卡,除采用了强大的风冷热管散热器之外,该显卡默认核心/显存频率高达700MHz /2200MHz,远高于公版GeFor c e 9600 GT,是目前超频版GeFor c e 9600 GT显卡中频率最高的一款,整体性能提升明显。此外,它还采用了双BIOS设计,用户可以通过显卡挡板上一个开关轻松实现BIOS的切换。丰富的接口也是这款产品的一大特色。它提供了包括DVI、HDMI、VGA、Displayport、S-Vedio以及SPDIF IN在内众多接口,为用户的音视频连接提供了强大的支持。
PhysX物理加速

我们对比了安装物理驱动前后GeForce 9600 GT显卡的3DMar kVantage成绩,发现改进后的物理驱动对显卡的3D性能已经很明显了,对GeForce 9600 GT而言,提升了1200左右,幅度达到了26%。安装物理驱动之后,原来由CPU负责完成的物理运算现在交由GPU来完成,体现在成绩上,可以发现3DMark Vantage CPU2子项成绩得以成倍提升,由原来的7.27变成了现在的93.51,换算到CPU成绩上,你会发现CPU 3DMark Vantage成绩猛涨到了22174分。
更高的游戏运行速度
通过对《GR AW 2》、《虚幻竞技场3》、《Nurien》以及《The GreatK u l u》等游戏试玩之后发现,游戏中粒子加速、光影转换、爆炸场面、烟尘处理等方面处理相比之前感觉更加真实。比如在《Ru nwa y》的一个场景中,Nurien在许多地方都利用了PhysX物理加速技术,因此能够带给玩家无与伦比的真实体验:发丝的飘逸更加自然,完全没有以前生硬的感觉;衣服的褶皱效果真实,并随舞者的身形自然改变,舞台上的喷雾效果也有一种让人身临其境的感觉……。而爆炸的真实特效在《虚幻竞技场3》中体验得更加明显。泥石飞溅、玻璃破碎、天花板掉落、炸弹爆炸以及子弹的飞行轨迹等效果,感觉更加震撼。
除了为您带来极富视觉冲击力的物理效果外,强大的GPU处理能力加上PhysX物理加速,也极大地提升了游戏的帧数。相对于普通PC平台,在《GRAW 2》和《虚幻竞技场3》中,优化PC的性能遥遥领先,差距非常明显。
音视频转换速度大大加快
目前高清影片越来越多,转换视频格式将成为一个热门话题。优化PC借助NVIDIA CUDA的功能和相关软件(《BadaBoom》),带来了更高的视频转换速度,耗时大大缩短,有时速度会提升近600%,为用户节约了大量的时间。
赋予了PC更强的计算能力
在科学计算中,G P U也开始展现强大的实力。除了对比的Folding@H ome外,在P D F加速,C A D计算加速,Matlab计算加速上,借助CUDA,GeForce 9600 GT GPU都展现了极为惊人的力量。可以看到在Matlab复杂的科学计算中,优化PC的速度比普通PC快了将近400%。
强大的高清视频解码能力
在高清视频解码方面,由于内置H.264和VC-1解码引擎,优化PC的CPU占用率大大降低,即使在播放1080p格式的高清视频时,CPU占用率也只有10%左右。
结语
在3D世界日益真实的今天,显卡又将涉足的领域延伸到了通用计算。在不久的将来,我们快速打开大量网页、文档,进行复杂的高清视频格式转换都将离不开GPU的帮助,显卡也将会在机箱内部占据越来越重要的地位。现在NVIDIA的CUDA为我们带来了以往不敢想象的运算能力,大幅提升了现有PC的性能,而这一切仅仅只是开端,优化PC的曙光就在眼前。