盈通·NVIDIA专栏

来源 :微型计算机 | 被引量 : 0次 | 上传用户:aspoptyy4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  曾几何时,我们终日讨论显卡性能为何无法满足游戏的需求。然而在DirectX 10显卡快速更迭的今天,显卡性能过剩论又俨然出现在我们面前——机箱里面安装有功耗超过一百瓦的显卡,大部分情况下却不过是在待机或者处理最简单的2D操作。难道显卡就只是游戏的附属硬件?答案绝对是否定的,因为所有显卡厂商都在不约而同地告诉我们:在未来,显卡理应做得更多。
  
  从GPGPU到CUDA,显卡还能做的更多
  
  其实早在GeForce FX时代就有许多研究机构开始就GPU的可编程性进行试验,在当时DirectX 9 API就首次实现了顶点着色器和像素着色器的可编程性,让程序员可以通过Shader程序,实现任何想要的画面效果。在当时就有人提出如果将输入GPU的数据由图像换成其它,能否让GPU实现更多的应用?
  当GPU进入DirectX 10时代以后,统一渲染架构在编程灵活性上获得了进一步的提升——顶点着色其和像素着色器被统一到了Streaming Processor(流处理器)内部,这样的变革不仅解放了游戏开发者,还给通用计算引来了新的曙光。NVIDIA的CUDA(ComputeUnified Device Architecture,统一计算设备架构)就在这样的形势下被提出。
  和以往单独构建硬件抽象层并且使用专用程序语言的GPU不同,NVIDIA的CUDA选择了更为务实的做法。我们可以把CUDA简单的看做是专为NVIDIA GPU设计的C语言开发环境。和以往的GPGPU需要程序员自行开发“迂回”的实现架构不同,CUDA在问世初期就拥有了完整直接的开发程序。NVIDIA给开发者提供的CUDA套件包括了nvcc C语言编译器、适用于GPU的CUDA FFT和BLAS库、CUDA分析器、GDB调试器以及CUDA运行时的驱动程序。除此以外,CUDA还拥有详尽的编程指南和大量范例供开发者参考。
  在CUDA的帮助下,开发者只需要专注于自己所开发的应用,剩下的GPU实现部分将由NVIDIA的编译器自行完成,完全无需像普通GPGPU应用那样针对每一款显卡设计各种复杂的算法。在NVIDIA的帮助下,CUDA迅速获得了大量业界厂商的支持。在CUDA问世不到一年时间内,许多应用程序就已经支持了这一标准,依靠GPU获得远比CPU强大得多的运行速度。NVIDIA CUDA的不断普及,使我们深刻体验到了GPU所隐藏的惊人运算能力。究竟在桌面应用中GPU能为我们多做些啥?接下来就让我们一起探究。
  
  通用有多快?CUDA实战
  
  Adobe Acrobat
  自从Adobe Acrobat生成的PDF格式文档成为世界文档交换标准,获得各大机构广泛采用以后,许多人都认为PDF打开文档的速度过于缓慢。如果你的文档中还包含大量的图片和3D对象,那打开时计算机陷入假死状态的情况几乎不可避免。
  为了解决PDF文档打开、编辑速度的问题,Adobe在2007年推出的Acrobat 8和Adobe Reader 8中加入了GPU加速功能和对NVIDIA CUDA架构的支持。我们只需要在Acrobat软件中选择编辑、设定栏目,就能在页面显示设置中找到使用2D图形加速选项。在点选这个选项后,Acrobat打开文档将会借助图形卡的处理能力,让整个打开过程变得极为迅速。在拖动复杂页面的时候,Acrobat也能保持流畅的速度,大幅提升了PDF文档的编辑和查看效率。
  在Adobe将其下的Acrobat升级到9.0后,新的软件更可以在处理内嵌3D对象和多媒体内容的时候,直接通过CUDA调用GPU资源,实现PDF文档内部的视频加速和3D图像渲染。这样的改进对于经常使用PDF格式作为交换文档的用户来说,有着极为重要的意义。
  
  Cooliris图片浏览(PicLens)
  除了打开PDF文档可以在CUDA的加速下瞬间搞定之外,在浏览网页和图片的时候,CUDA也照样能大显身手。一个叫做Pic Lens的插件可以让我们快速浏览各种照片和视频,并且拥有极为科幻漂亮的外观。在完全支持CUDA之后,PicLens改名叫做Cooliris,可以让我们以3D的形式浏览图片。这款软件支持Firefox、 Internet Explorer及Safari等常用浏览器,借助G P U的运算能力,对Facebook、 Flickr、 Goggle、Picasa、 Yahoo、 Youtube等应用创建出3D视觉搜寻接口。
  Cooliris有如“未来报告”般的操作接口,实时做出一道立体墙 (3DWall) ,将搜寻结果展现于3D空间内。用户还还可使用鼠标控制移动方向,实现无缝转页,并容许随时放大、缩小图片或播放影片,使搜寻更方便快捷、更见乐趣。
  
  Adobe Flash Player
  在富媒体应用时代*,每当我们打开一些大型网站,都会因为FLASH过多而出现“卡壳”的现象。在同时打开多个Youtube等视频点播窗口时,CPU占用率大幅提升似乎也是不可避免的。事实上,在CUDA的帮忙下,打开充满FLASH的网页也照样运转如飞。
  * 注释:富媒体应用即RichMedia。这种应用就是采取所有可能采取的最先进技术来传达信息以及与用户进行互动。FLASH、带有视频的Web应用都可以叫做富媒体。
  在Adobe FLASH Player 10及其浏览器插件中,已经加入了对GPU加速的支持。我们只需要打开任何一个使用FLASH的网站,在FLASH上点击右键然后选择设置,我们就可以看到硬件加速选项。
  根据Adobe的规划,新一代FLASHPlayer 10插件除了提供常规的FLASHCUDA加速之外,还将提供H.264视频的硬件解码加速支持。这样我们在看高质量Youtube视频的时候,就完全无须担心CPU占用率过高等问题。
  
  TMPGEnc 4.0 Xpress视频转换
  
  一直以来用电脑进行各种视频格式的转换都是件费时费力的事情,进入高清时代,视频编码格式转换的时间更是大幅增加。如今使用4内核处理器配合H.264编码器压缩一段视频,速度只有0.3FPS——这意味着完成一部电影的压缩,所耗费的时间将会是电影播放长度3倍以上。而在我们的数字生活中,却经常需要把各种格式的视频转换放入iPod、PSP甚至是MP4中。
  既然我们可以通过GPU实现硬件高清视频解码,那能否用GPU来完成硬件高清视频编码?在CUDA的帮助下,业界著名编码器TMPGEnC 4.0终于实现了G P U硬件加速编码。在TMPGEnC 4.0上,通过CUDA,软件可以借助GPU来完成视频过滤等操作, 在打开GPU硬件加速后编码器可以获得446%的编码速度提升,极大地减少了视频转换所耗费的时间。
  
  实际体验
  
  对于游戏玩家来说最切身的体验毫无疑问是PhysX物理加速,而对音视频玩家,新的显卡强大的CUDA引擎以及对H.264和VC-1的硬解码能力无疑让人惊喜,那它们究竟会带了多大的性能提升呢?也许通过两个新旧平台的测试就可以一目了然。
  
  点评:显卡我们选用了能够支持PhysX物理加速的G9600GT游戏高手全能版。这是盈通推出的一款超频板GeFo r c e 9600 GT显卡,除采用了强大的风冷热管散热器之外,该显卡默认核心/显存频率高达700MHz /2200MHz,远高于公版GeFor c e 9600 GT,是目前超频版GeFor c e 9600 GT显卡中频率最高的一款,整体性能提升明显。此外,它还采用了双BIOS设计,用户可以通过显卡挡板上一个开关轻松实现BIOS的切换。丰富的接口也是这款产品的一大特色。它提供了包括DVI、HDMI、VGA、Displayport、S-Vedio以及SPDIF IN在内众多接口,为用户的音视频连接提供了强大的支持。
  
  PhysX物理加速
  
  我们对比了安装物理驱动前后GeForce 9600 GT显卡的3DMar kVantage成绩,发现改进后的物理驱动对显卡的3D性能已经很明显了,对GeForce 9600 GT而言,提升了1200左右,幅度达到了26%。安装物理驱动之后,原来由CPU负责完成的物理运算现在交由GPU来完成,体现在成绩上,可以发现3DMark Vantage CPU2子项成绩得以成倍提升,由原来的7.27变成了现在的93.51,换算到CPU成绩上,你会发现CPU 3DMark Vantage成绩猛涨到了22174分。
  
  更高的游戏运行速度
  通过对《GR AW 2》、《虚幻竞技场3》、《Nurien》以及《The GreatK u l u》等游戏试玩之后发现,游戏中粒子加速、光影转换、爆炸场面、烟尘处理等方面处理相比之前感觉更加真实。比如在《Ru nwa y》的一个场景中,Nurien在许多地方都利用了PhysX物理加速技术,因此能够带给玩家无与伦比的真实体验:发丝的飘逸更加自然,完全没有以前生硬的感觉;衣服的褶皱效果真实,并随舞者的身形自然改变,舞台上的喷雾效果也有一种让人身临其境的感觉……。而爆炸的真实特效在《虚幻竞技场3》中体验得更加明显。泥石飞溅、玻璃破碎、天花板掉落、炸弹爆炸以及子弹的飞行轨迹等效果,感觉更加震撼。
  除了为您带来极富视觉冲击力的物理效果外,强大的GPU处理能力加上PhysX物理加速,也极大地提升了游戏的帧数。相对于普通PC平台,在《GRAW 2》和《虚幻竞技场3》中,优化PC的性能遥遥领先,差距非常明显。
  
  音视频转换速度大大加快
  目前高清影片越来越多,转换视频格式将成为一个热门话题。优化PC借助NVIDIA CUDA的功能和相关软件(《BadaBoom》),带来了更高的视频转换速度,耗时大大缩短,有时速度会提升近600%,为用户节约了大量的时间。
  
  赋予了PC更强的计算能力
  在科学计算中,G P U也开始展现强大的实力。除了对比的Folding@H ome外,在P D F加速,C A D计算加速,Matlab计算加速上,借助CUDA,GeForce 9600 GT GPU都展现了极为惊人的力量。可以看到在Matlab复杂的科学计算中,优化PC的速度比普通PC快了将近400%。
  
  强大的高清视频解码能力
  在高清视频解码方面,由于内置H.264和VC-1解码引擎,优化PC的CPU占用率大大降低,即使在播放1080p格式的高清视频时,CPU占用率也只有10%左右。
  
  结语
  
  在3D世界日益真实的今天,显卡又将涉足的领域延伸到了通用计算。在不久的将来,我们快速打开大量网页、文档,进行复杂的高清视频格式转换都将离不开GPU的帮助,显卡也将会在机箱内部占据越来越重要的地位。现在NVIDIA的CUDA为我们带来了以往不敢想象的运算能力,大幅提升了现有PC的性能,而这一切仅仅只是开端,优化PC的曙光就在眼前。
其他文献
测试手记:199元容量1CB的名牌MP3播放器堪称目前最具性价比的数码随身听,要知道,同容量的名牌闪盘也要一百多元,若用户需要欣赏MP3,又不想随身携带太多产品,显然买199元的MP3播放器比买闪盘更划算,当然,市面上也有不少价格相当或更便宜的杂牌MP3播放器,但综合制造成本以及售后服务等多方面因素,建议大家还是选择名牌MP3更为放心。    近一两年来,国内MP3市场中价格战几乎每天都在上演,各
金邦千禧DDR2 800 2GB内存是一款面向主流市场的产品。可以看到,与我们之前介绍的金邦中、高端内存相比,由于定位主流,这款金邦千禧DDR2 800内存在外观上显得比较普通,没有配备散热片。但该内存在“基础设计”上仍达到了较高的水准,采用全尺寸的墨绿色6层PCB电路板制作,而现在市场上很多品牌的主流产品大多采用了窄版设计。该内存正反两面采用大面积覆铜设计可以减小地线阻抗,提高电源效率,减少高频
如果要问怎么实现显示器屏幕的扩展,你会怎么做?那还不简单,首先要有一块至少具有两个输出接口的显卡,然后分别将两台显示器连接到显卡上,最后在系统的显示属性中进行设置就好了。而现在,有款LCD不需要显卡却能同时实现六台的屏幕扩展,是不是很有意思?就请随本文一起来了解它吧。    在许多商务领域,如金融、证券行业,需要进行信息演示时往往会将多台显示器的屏幕拼接起来,以获得更多信息的展示。而一些个人用户,
【摘要】微课是一种新型教学资源。在大学英语教学中运用微课教学模式,可以激发学生学习兴趣,提高英语教学的实效性。本文对微课在大学英语教学中的优势进行了简要分析,进而提出了微课运用于大学英语教学的可行性措施。希望能给大学英语教学有益的参考与借鉴。  【关键词】大学英语 微课 运用 策略  时代的进步、信息技术的发展,促进了大学英语教学模式的改革与创新,微课教学模式正是信息网络技术发展的产物。微课可以使
春天里,天气回暖,万物复苏,一片欣欣向荣的景象。相信很多学生朋友们也在春暖花开的时节返回校园,开始新学期的生活、说到学校,现在计算机普及的程度越来越高,拥有自己笔记本电脑的学生朋友们已经不在少数而且在实验室,宿舍以及其它一些公共场合网络接口不足的问题也愈发明显。这个时候,大家想尽各种办法,集线器、交换机、路由器一拥而上,网线也是乐拉一条、西扯一根。上网的问题虽然解决了,但是我们的宿舍也变成了“盘丝
【摘要】本文针对新课程下高中英语教学中作业布置普遍存在的问题进行分析和探讨。调查研究发现,当下较多英语教师在英语作业设计上存在一些问题,导致英语作业所体现的效果不明显,为了能够使英语作业布置更加有效,提高学生的综合能力,本文提出了作业有效性的几个策略。  【关键词】新课标高中英语作业有效性  一、引言  1.学生在课堂上所学的知识必须经过课后的不断巩固,才能被长久地记忆,也只有通过课后的不断巩固和
【摘要】书面表达在中高考试卷中都是压轴题,也是学生望而生畏、退避三舍的难题,历年来的中高考试卷分析,书面表达失分十分惨重。本文结合高考英语全国卷的书面表达题,谈谈如何写出靓丽的高考英语作文,在高考中夺得高分。  【关键词】高中英语 书面表达 形式 内容 篇章  高考英语书面表达所占的分值高,难度系数大,综合性强等特点,又是学生拉开分数段的大题之一,可谓是英语试卷的压轴题。然而,根据历年来的高考英语
2009年的LCD市场怎一个“乱”,字了得,不仅价格乱,规格也乱。除了16:9与16:10两种  屏幕比例之争外,不同尺寸规格的产品更是搞得消费者晕头转向。其中去年市场的主力16:10的19英寸产品和16:9的18.5英寸产品已经转移到入门级市场,而空出来的主流市场最有希望的占领者原本是16:10的22英寸LCD,但由于上游面板厂纷纷将显示器面板的切割转移到更高代的面板生产线,22英寸面板的供应量
热心读者 文亮:由于公司业务需要,准备购置一款黑白激光打印机,于是笔者在网上查询资料,对各品牌激打比较过后,最终目标锁定惠普LJ 1020。  我来到一家打印机专卖店,开门见山地说:“惠普LJ 1020的价位是多少?”一位小伙子神色自然地回答:“1350元”,又问我带不带票,由于这是公司购买,“当然要带!”“带票就这个件。”“那不带票的价格呢?”“不带票可以给你按1200元整,我们是惠普的特约维修
暗藏玄机的硬盘曲线      要弄清问题,请先随菜菜来了解硬盘读取速度的相关知识。通常,硬盘读取曲线可以直观描述硬盘读取速度的快慢,它和函数图像类似,同样位于一个坐标系中。在坐标系中,横轴代表硬盘磁头从盘片外侧向盘片内侧运动时的读取位置,纵轴则表示硬盘数据读取速度。一块5400rpm 2.5英寸笔记本电脑硬盘的读取速率曲线,读取速度在35~65MB/s,主流7200rpm 3.5英寸台式硬盘的读取