怪兽:市场上的巨型显卡

来源 :个人电脑 | 被引量 : 0次 | 上传用户:a419132258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  毫无疑问,每年的暑期档,除了充斥着各种好莱坞电影外,就是各大游戏公司发布的各类新游戏了。至少对热衷于游戏的玩家而言,除去能够刺激肾上腺素分泌的火爆大片之外,也就只有场景与电影相比有过之而无不及的3D游戏才有类似的功效了。比较有趣的现象是目前的主流游戏市场呈现的是一种融合的趋势,以往泾渭分明的游戏机市场和PC游戏市场正在逐渐融合,而二者共同的“敌人”则是新兴的“移动游戏”市场。iOS也好,Android也罢,此类操作系统的设备性能之强悍令人诧异,跑一些简单的3D游戏完全不成问题,加之此类设备的普及性远比游戏机、PC范围更大;而其开发成本之低,同样令人惊讶。于是乎,对于不少普通玩家而言,简单、有趣,画面同样出色的“移动游戏”成了打发时间的最佳选择。
  面对新兴的挑战,传统的游戏厂商态度还是比较积极的。比如说EA就将多款热门游戏移植到了移动平台上,并且效果还不错。与此同时,EA也加强了传统平台上(包括PC及游戏机)游戏的开发投入——要想保持传统游戏市场不被“移动游戏”市场上的挑战者们搞掉,就要竖起更高的门槛,做移动设备做不到的事情——那就是更强的画面、更高的游戏性、更复杂的游戏。当然,这也意味着更大的投入。而前面提到的“融合”趋势,早在移动市场火爆之前,就已经开始了。因为移植一款作品,远比重新开发一款新产品的投入小得多,但却可以卖出更多的拷贝。因而,跨平台是过去两年的,也是未来一段时间的趋势。所以我们才会看到原本在游戏机平台上的大作纷纷出现在PC领域。同样,原本是PC领域的看家大作,也会出现在游戏机平台上。
  相对现在主流的两款高清游戏机——Xbox 360和Play Station 3而言,同样一款作品的PC版往往拥有更好的画面效果,甚至更多的游戏内容。最明显的一个例子就是Epic推出的《战争机器》了,这款游戏移植到PC后,不但画面更为优秀,并且整整比Xbox 360版多出了一章情节——世就是说,PC版才是完整的,而游戏机上的版本受限于存储介质的限制,只能做到那么多。这种现象其实不难理解,其实存储介质容量限制只是一方面原因。更多的原因是在游戏机平台上开发游戏是受到严重限制的。比如说Xbox360是5年前推出的主机,各方面配置根本无法与现在的PC相提并论,而且它不能升级。与游戏机相比,PC上的内存、硬盘、显卡简直就是无尽的资源,开发人员不用担心内存是不是不够了,显卡是不是跑不了庞大的场景,或者是做了这么多内容1张甚至2张DVD到底能不能装的下——这些在PC上都不是问题。所以,想要最好的效果,PC是最佳选择——只不过游戏发行速度略慢一些,这个问题目前也在改善中。
  但是,问题又来了,想要在PC上达到最强大的画面效果,离不开强悍的3D显示卡,这是老生常谈。而且显卡和游戏总是相辅相成水涨船高,呈螺旋上升趋势不断进化……这是一个多么令人恼火的结论呢?简单来说,就是你现在买了一块昂贵的显卡,1年,最多2年以后,你就要再买一块了。有可能是它不够快,不能流畅的运行你想要的游戏;也有可能是它不够新,就算够快,也显示不出那些新奇、绚丽的新3D效果。为此,你就不得不升级你的显卡。相应的,同时你可能还要升级你的内存、主板、CPU……看起来这是一个圈套对吧?但我们仍然乐此不疲,为什么?
  不管那么多了,现在我们要做的就是带你看看最新的“怪兽”们,为什么叫怪兽?当你看到这些显卡的尺寸时,估计你就会认同我的观点了,单从外形上来看,它们绝对就称得上是怪兽了,更别说它们夸张的配置了。
  
  二虎相争
  
  这句话的后半句是“必有一伤”。但奇怪的是,3D显卡领域的两只大老虎都活的很好,虽然竞争很激烈,但两家厂商也未见有谁受伤,无非是“最快的显卡”这把交椅两家厂商轮流坐。当然,非要说ATi当年混的不好被AMD收购,也无可厚非。但从与AMD合并后推出的一系列产品来看,合并并非坏事;相对的,NVIDIA一直处于独立状态,也未见的就比AMD好过多少。综合来看,两家厂商长久以来保持着一种微妙的平衡——轮番推出新产品,抢劫用户的钱包——倒是两家的粉丝们战的不可开交。
  战归战,卡还是要出,用户也还是要买。无非就是买什么卡的问题,这个还是比较好解决的,比较一番自然就有结果。接下来我们就先来看看两家显卡厂商最近推出了些什么产品,首先是AMD。
  
  AMD Radeon HD 6000系列
  
  该如何形容AMD呢……真的挺难的。因为很难想象,一家做芯片的厂商会把自己家的产品线划分到如此细致的程度——算上专门针对OEM市场的产品,AMD的RadeonHD 6000系列一共有11个型号的产品。从旗舰级的双核心显卡Radeon HD 6990到面向低端应用的入门级产品Radeon HD 6450,总计11款。看着有点头大对吧?实际上,按照高中低三条线来划分,理解起来还是比较简单的。高端的包括Radeon HD 6990、Radeon HD 6970、Radeon HD 6950;然后是Radeon HD 6870、6850;再下来是Radeon HD 6790、6770、6750;然后就是入门级的Radeon HD 6450了。不用好奇为什么只有9款,因为另外两款是Radeon HD6670和Radeon HD 6570,是针对OEM市场推出的产品,并不在DIY市场流通,不过不排除将来有这种产品在市面上出现的可能。
  这么看下来,实际上每一条线上,AMD都有至少两款产品在售。不过实际上AMD可能并不希望像我们这样简单粗暴的将这些产品粗略的分为三条线,AMD可能更倾向于模糊产品线概念,这样它才能用相似的价格但性能略好于竞争对手的产品,以这种特殊的定位方式战胜对手。也不失为一种策略,但对于用户来说,恐怕就比较恼火了——到底要选哪个型号才对,这就是用户遇到的难题。实际上,这一系列产品有着相似甚至是相同的核心架构,区别之处只是管线数量、频率、显存位宽之类的差异。而正是这些细微的差异,会对用户造成很大的困扰,比如说“为什么两款产品显存容量相同,但一个要比另一个贵?”这时候卖卡的会说“因为管线多一组”。那多了一组又有什么效果呢?卖卡的也说不清楚,普通用户也搞不明白。
  实际上,基于可扩展的架构体系,Radeon HD 6000系列的顶级产品应该是Radeon HD 6970,单核心,最高配置,这就是这一系列中未缩水的原型产品了。而更高端的Radeon HD 6990实际上是用了两颗Radeon HD 6970核心组建而成,其基本架构不用多说,仍然与Radeon HD 6970一样。这种方式虽然略显简单粗暴了一些, 但确实有效,性能提升是明摆着的。而全新的Radeon HD6970其核心代号为“Cayman”,采用40nm制程设计,内部集成26.4亿个晶体管。当然,这是Radeon HD 6970的基本情况,其他型号产品的晶体管数量会更少一些,具体差异请在随后的表格中查询。而Radeon HD 6800(Barts)系列产品则是沿用之前的Radeon HD 5870的设计思路,变化不大。不过Cayman自己也并非是全新设计,而是基于之前的Cypress改进而来,这一点上与Barts相比,倒也没有太大差异。只不过Cayman相比Cypress的变化更大。
  首先,AMD要做的就是设计一款效率更高的架构,早在之前的Radeon HD 5800系列产品上,AMD就是用了一种被称为VLIW(Very long Instruction Word)的架构,实际上这是一种指令级并行运算体系架构。此前的Radeon HD 5800、6800系列核心内每一个SIMD内部拥有5个StreamProcessing Unite,其中4个是普通的StreamCore,另外一个作为专门处理浮点MAD运算使用的特殊运算器使用,所有的5个SP可以实现指令级并行运算,这就是VLIW5架构。而事实证明,这VLIW5架构的性能表现并未达到设计时期望的效果,尤其是专门用来负责处理浮点MAD运算的SP利用率并不高。为此,在新的Cayman中,AMD将VLIW5架构改成了VLIW4架构,去掉了专门用于特殊计算的SP,每一个Shader中为4个可以进行指令级并行运算的SP。
  其实这与目前GPU领域的芯片制程工艺有很大关系,受限于台积电(TSMC)的40nm制造工艺,想要获取更好的性能,就不得不在架构上做文章。由于制程工艺及芯片面积的限制,如何能加入更多的SP就是提升性能的关键所在(基于现有架构,增加SP仍然是最主要的性能提升手段)。因而,AMD将VLIW5变成现在的VLIW4,可以增加更多的通用Stream Processor。而且更多的通用SP完全可以弥补取消了特殊运算器带来的功能、性能损失。这就是AMD Cayman架构的核心设计思路。事实上,经过这样的优化,Cayman获取了多达10%的芯片面积,用于增加通用型SP数量。经过重新优化的VLIW4架构中,每一个SIMD中的SP可以实现每时钟周期4次32bit精度浮点FMA、MAD、MUL,或是ADD运算;2次64bit精度浮点ADD运算;1次64bit精度浮点FMA运算;1次浮点特殊函数运算;4次24bit精度整数型MAD、MUL或ADD运算;4次32bit精度整数型ADD运算;1次32bit精度整数型MAD或MUL运算;1次64bit精度ADD运算。看上去与之前的VLIW5架构相比,在功能上并无不同,但性能上要明显好于之前的架构,在处理16bit渲染操作时可以提升2倍的性能;32bit浮点运算操作提升2~4倍运算速度。其直接效果就是新一代架构让Cayman的抗锯齿性能极大的提升了。
  如果拿Cayman核心架构和Cypress相比,你会发现Cayman中的SP频率没有提升,反倒下降到了800MHz,不过不要忘了Cayman的SP数量可是比Cypress多出不少。1536比Barts的1440多了96个SP。不要小看这96个SP,正是这96个多出来的SP,让Cayman的运算能力达到了675GFLOPS(Giga FLOPS=10亿次浮点运算),而Cypress只有544GFLOPS。而且Cayman的双路双向DMA引擎使得从GPU到系统总线的传输速率大幅提升。除此之外,Cayman延续了Cypress的缓存设计,每一组SIMD阵列拥有独立的8KB L1 Cache,另外还有16KB专用材质缓存,以及32KB本地数据共享缓存;除此之外每组SIMD还配有128KB L2Cache,以保证SIMD能够得到足够多的数据。当然,所有的SIMD还共享有64KB全局库缓存。
  此外,Cayman架构开始支持异构计算,可以使用GPU来协助CPU进行运算。这并不是什么新鲜的技术了,NVIDIA的Fermi早已支持。只不过,目前这项功能并不是DirectX的一部分(就算是DirectX 11也不行),所以暂时还无法使用,除非AMD通过OpenCL来对该功能提供支持。至于DirectX11中的重头戏几何运算,AMD给Cayman配备了两组几何处理引擎,用于计算变形、建模、消隐面以及Tessellation运算。Cayman可以在单时钟周期内同时处理2个三角形,而之前的Cypress和Barts只能完成1个。
  Cayman继续支持AMD的Eyefinity技术,单块显卡可以提供多达6路输出,并且支持Display Port 1.2技术规范,可以方便的连接Multi-Stream转换器,实现多屏输出。不过即便不是用Display Port,RadeonHD 6970仍然能够提供至少3路输出,连接多个显示设备不再是什么困难的事情。同时,Cayman开始重新支持CSAA全屏抗锯齿模式,这种抗锯齿模式的优势在于它是一种完全基于Post-Processing过滤技术(该技术由DirectX提供支持)的抗锯齿技术,可以在游戏本身不提供抗锯齿支持的情况下为3D渲染画面提供抗锯齿功能。而另外一项被称为EQAA(Enhanced Quality Anti-Aliasing)的抗锯齿技术则可以将现有的MSAA抗锯齿技术的精度提升到每像素16个覆盖样本,可以大范围提高MSAA抗锯齿的精度。
  除此之外,伴随Cayman而来的是AMD的视频加速技术UVD 3。经过升级后的UVD3可以提供MPEG-4 ASP格式的编解码加速,为MPEG-2格式的编解码运算提供更好的性能,并且开始对Multiview Video编解码提供支持,当然UVD 3也能为H.264/MPEG-4 AVC提供全面的支持,无论是在播放还是在编码方面都有更好的表现。事实上,Cayman可以轻松的提供对3D Blu-ray及HDMI 1.4a提供完整的硬件级支持。
  除了基本架构及性能的问题,对于怪兽级显卡,用户可能会更关心GPU的功耗问题(价格倒在其次)。Radeon HD 6970开始支持AMD的Power Tune功耗控制技术。这项技术与以往的功耗控制技术相比更为复杂一些。以往的功耗控制技术往往只有两个状态——全速运转和系统待机,换句话说就是除了系统待机,就是全速运转。而新的功耗控制技术则可以根据实际的运行情况对功耗进行动态调整,尤其是在用户对显卡进行超 频的时候,除了可以有效的控制功耗外,该技术还能够确保用户不会过于暴力的超频导致显卡损坏。
  以上,就是AMD当前的旗舰级3D显示核心Cayman的一些基本情况。回到之前我们提到的产品线划分上来,AMD的旗舰级产品为Radeon HD 6990、6970、6950三款,这三款产品均使用Cayman核心,Radeon HD 6970是Cayman的标准款式,拥有24组SIMD流处理器阵列,96组材质处理单元,SP运行频率为880MHz,显存位宽为256bit,支持2GB GDDR5显存。更高端的Radeon HD 6990则是使用两颗Radeon HD6970通过内部的Cross Fire连接组件的单卡双核心产品,以上参数乘以2,就是它的基本参数了。而Radeon HD 6950则是6970的阉割版,虽然核心相同,但Radeon HD6950的SIMD阵列数量只有22组,88个材质处理单元。当然,显存容量、显存频率、核心频率等参数也都有下调,以便区分产品,更细致的划分产品线。
  而中高端产品段位上的Radeon HD6870、Radeon HD 6850、Radeon HD6790则是使用之前的Barts核心架构,与最新的Cayman略有差异,但同样是基于统一渲染架构的DirectX 11显示核心;而主流市场的Radeon HD 6770、6750实际上是此前的Radeon HD 5770、5750重新命名而来;同样的,入门级的Radeon HD 6450,代号为Caicos的显示核心,同样是简化自Barts。这些产品的具体差异,可以在随后的表格中查询,这里就不再一一介绍了。
  
  NVIDIA GeForce 500系列
  
  相对与拥有11款产品的Radeon HD6000系列,NVIDIA的GeForce 500系列就要简单的多了。不过像我们这样划分产品,实际上是与NVIDIA自身的产品规划略有差异的,NVIDIA目前采用的产品划分方式是GeForce GTX一档、GeForce GTS和GT一档、GeForce一档。这样做的好处是可以按照性能表现来划分产品,模糊每一代产品之间的界限,对于NVIDIA来说,是有助于产品销售的;而对于用户来说,这可不是什么好的产品线划分方式,用户还是更倾向于按照GPU的“世代”来划分产品,虽然比较传统,但更好理解一些。不过我们建议用户还是逐渐适应NVIDIA这种新的产品线划分方式比较好。因为,以目前的NVIDIA产品来看,各款GPU之间的基本架构比较接近,所谓的“世代”的确是比较模糊,相信这也是NVIDIA采用新的产品线划分方式的主要原因。
  不管怎么说,新一代的GeForce 500系列产品拥有7款产品。位于旗舰级位置的是GeForce GTX 590和580;然后是GeForceGTX 570、GeForce GTX 560 rri、GeForceGTX 560;接下来是GeEorce GTX 550Ti;最后是面向入门级应用的GeForce GT520。这是目前NVIDIA的全部“5系”产品,看上去要比竞争对手少一些。不过按照NVIDIA的产品部署方式,同处于GeForceGTX阵营的还有此前的性价比之王GeForceGTX 460;GeForce GTS和GT阵营以及此前市场占有率的常青树GeForce GTS 250。再加上上一代的GeForce GT 440等产品,实际上NVIDIA的产品线还是相当丰富的。不过,对于追新的用户来说,只关注“5系”产品即可。
  与以往一样,让我们从旗舰级的GeForce GTX 580入手,来了解NVIDIA的新GPU,更高级的GeForce GTX 590实际上是由两颗GeForce GTX 580核心组成的单卡双核心产品,架构上与GeForce GTX 580并无区别。GeForce GTX 580的研发代号为GF110,从编号上来看,与之前的GF100相比,变化就很小。这是因为当时NVIDIA的上一代产品GeForce GTX 480性能足够好,当时可以轻松的干掉竞争对手的Radeon HD5870,而发布产品之时,NVIDIA就曾坦言其实还有更高端的产品在研发阶段,现在没有必要放出来,因为GeForce GTX 480足够。这时NVIDIA提到的GPU,应该就是现在的GF110,也就是GeForce GTX 580。而通过之前的专题测试,我们也曾提到当时的Fermi并不是完整版,真正的完整版Fermi还未出现。
  到底是为什么当时NVIDIA不发布完整版的Fermi呢?有很多因素可能造成NVIDIA当时不发布完整版Fermi,比如前面提到的性能对比,既然不完整的Fermi已经占尽优势,不如有所保留;又比如说价格问题、良品率问题,以及自身产品线设定的竞争空间等等,至于到底是为什么,我们也只能是猜测一番,无法得出准确结论。不管怎么说,现在NVIDIA放出了GF110,比GF100性能更好,但仍然是基于Fermi架构的一款GPU。在此,我们不妨先回顾一下Fermi的特性,再来看看GF110到底有哪些改进。
  首先,Fermi的架构源自之前的GT200,也就是Tesla;而GT200则起源于更早的G80核心。对于Fermi而言,其内部渲染核心,也就是我们比较熟悉的StreamProcessor,正式更名为CUDA Core,并且在整体架构设计方面有了较大的变化,但统一渲染架构的基本思路并未改变。我们知道,GT200系列最强悍的单芯片GPUGeForce GTX285的CUDA Core数量为240个;而Fermi的CUDA Core数量为512个。在这种情况下,即便不做其他改动,仅靠CUDA Core数量的增长,也会获得至少2倍于GeForce GTX285的性能提升。之前GT200核心架构中,支持10组被称之为Texture ProcessingClusters(材质处理集群,TPC)的处理区块,每一组TPC具有三组StreamingMultiprocessors(流式多路处理单元,SM),这些StreamingMultiprocessors内部包含8个SP及8个材质处理单元。而现在这个架构进一步进化成设计的更为精巧的资源整合型结构——Fermi将所有这些资源,整合成4个功能区块——这就是Fermi的核心架构GraphicProcessor Clusters(图形处理集群,GPC)。
  这些被称之为GPC的运算集群取代了之前的TPC,并且将之前在独立于TPC 之外的功能模块整合进Fermi的GPC运算集群中来。Fermi的GPC运算集群包括升级到4组SM的GPC光栅引擎,每一组SM包括32个CUDA Core,同时集成4组专用材质单元,这些材质单元支持双路动态线程调度技术,并且具备64KB独立可编程共享缓存。从数量上来看,GT200的材质单元要比Fermi更多,GT200每一组TPC中包含8个材质单元,而一颗GPU中则有10组TPC;而Fermi核心每一组SM配备4个材质单元,总计64个材质单元。但由于Fermi的每个材质单元每个时钟周期内可以完成一个材质运算,并获取4个材质样本,所以从实际性能上来看,Fermi架构实际上是要优于之前的GT200的。
  Fermi的线程调度则由全新的GigaThread引擎完成,负责给Fermi的16组SM分配渲染任务。GigaThread是Fermi架构的重要核心部分,这套引擎可以并行创建并指派线程,较之之前的单线程轮询过程要更为高效。当然,GigaThread引擎同样要从显存中获取数据,所以乍看上去Fermi的6组64bit,总计384bit的显存位宽,好像要比GT200的8组64bit,总计512bit显存位宽来得差一些。然而,NVIDIA这次给Fermi配备的是GDDR5显存,GDDR5的带宽本身就要比GDDR3更高,因此实际上Fermi并不需要过多的显存控制器,也能获取较高的显存带宽。
  在Fermi架构中,处于最末端的是6组ROP(Raster Operater Unit,光栅处理单元),这些ROP在同时输出8个32bit整数型像素。相对而言,之前的GT200的8组ROP在单个时钟周期内只能输出4个整数型像素。虽然Fermi仍然保持单周期64bit内存控制器模式,但将每周期输出32个整数型像素提升到了每周期输出48个整数型像素。因而,Fermi可以支持一种全新的全屏抗锯齿模式——32x CSAA模式。并且,在32xCSAA模式下,只比8x MSAA模式损失约10%的性能。
  接下来,我们来看看同样是基于Fermi架构的GF110到底有哪些改进,能够使得GeForce GTX 580的性能较之之前的产品大幅提升。从前面对Fermi的回顾不难发现,提到Fermi,首先让人印象深刻的就是512个CUDA Core,而实际上当时的GeForceGTX 480只用到了480个CUDA Core,这就是为什么我们当时把GeForce GTX 480称为“不完整的”Fermi。而此次的GeForceGTX 580拥有全部的512个CUDA Core,SM渲染阵列的数量也比之前的GeForceGTX 480多了1组,从15组变成了现在的16组;同时,材质单元也由原来的60个,提升到了64个。当然,核心频率、Shader频率、显存频率等相关参数也均有提升,这些信息可以在随后的表格中查询,这里就不再多说。
  然则仅仅是这种“数量”的提升是不足以让GF100升级到GF110的,GF110必然有些与众不同之处,否则同样是一款40nm制程的GPU,基于同样的架构,重新拿出来着实欠缺诚意。GF110实际上是有两项比较重大的改进的,其一是可以全速进行FP 16材质过滤,并且大幅度提升了Z-Cull的效能。GF110可以在单时钟周期内完成一次完整的FP 16精度材质过滤,而此前的GF100完成同样操作需要两个时钟周期。这样一来,在一些材质运算较多的应用上,GF110实际上会得到更好的性能。而Z-Cull实际上相当于竞争对手的Hyper-Z,该技术主要功能是预先对要渲染的像素集群进行处理、筛选,通常在对像素进行光栅化的过程中进行。这样做的好处是可以尽可能提供更多的可用显存,只需要牺牲小部分显存带宽就可以实现。其优势主要体现在处理大量大尺寸材质、光线追踪等渲染时,可以减少频繁从内存读取数据的过程,从而提升运算效率。
  此外,为了进一步加强芯片在处理几何运算及Tessellation方面的性能,GF110的每一组SM阵列中都设有一组专门用于处理几何运算的PolyMorph引擎。这一点可以算作是对未来的投资,目前的首批DirectX 11游戏中,使用到复杂的几何建模及复合曲面生成的作品并不多。但毕竟Tessellation是DirectX 11中的标准功能,而且这项功能的确可以帮助游戏设计者创造更为真实的物体、世界,所以大范围普及也是指日可待。
  以上就是GF110的基本情况了,按照显卡芯片厂商们一贯的做法,同一系列的其他产品线产品,通常会根据旗舰级产品的设计,进行小范围修改以适应该段位产品的目标价格需求。有意思的是,NVIDIA在新的产品线上重新启用了过去的标识“Ti”,从而进一步细化了产品线,比如处于中高端的产品实际上是由GeForce GTX 560Ti和GeForce GTX 560组成的一条复合产品线。虽然目前高端产品线由GeForce GTX 590、580、以及570组成,但不排除为了应对竞争对手繁杂的产品线划分推出GeForce GTX570 Ti的可能。
  不管怎么说,实际上这些更为重视性价比的中端主流产品,乃至入门级产品,才是广大用户所关注的,我们来看看这些产品与顶级的GeForee GTX 580有什么区别,好在它们的架构基本上是一脉相承的。GeForce GTX 570实际上是关掉了一组SM,即拥有480个CUDA Core的GF110,其基本规格与之前的GeForce GTX 480有些相似;而GeForce GTX 560 Ti则是将GPC(图形处理集群)数量减少到2个,SM阵列减少到8组,拥有384个CUDA Core,代号为GF114的产品;而GeForce GTX 560则是在GeForce GTX 560 Ti基础上,关掉了一组SM阵列获得的(原来Ti等于一组SM阵列);到了GeForce GTX 550 Ti,GPC的数量只剩下1组,这一组拥有4组SM阵列;至于入门级的GeForce GT 520,则是一款面向视频应用的产品,仅提供48个CUDACore。
  以上,就是NVIDIA近期更新后的产品线情况。总体看来Fermi架构还将沿用一段时间,直到有更新、执行效率更高的架构被设计出来,在NVIDIA的产品线中,Fermi将是绝对的主流。至于各款芯片的详细细节,可以在随后的芯片特征总览中查询,这里就不再详细描述了。
  
  大怪兽大胃口
  
  回到最初的讨论上来,为什么说“有怪兽”呢?这是因为这些新推出的产品都出奇的大,并且对电源要求极高。特别是处于旗舰级的几款产品,像是GeForce GTX 580、 Radeon HD 6970,这些显卡夸张到需要两条8pin PCI-E供电才能工作,而我们测试使用的某品牌750w电源在插上这些显卡后,竟然无法正常开机,再更换电源后,测试才得以正常进行。而尺寸上,大家常见的那些机箱产品,基本上别想安装这些个头夸张的显卡。对于正常设计的机箱而言,正对着主板上PCI-E插槽的位置,一般来说是硬盘仓位,这些怪兽们的长度超过了主板的最大尺寸,会卡在机箱的硬盘仓那里上不去也下不来。相对来说,处于中高端的产品在外形尺寸上要好一些,但对于普通机箱来说仍然很紧张,并且往往也需要两条6pin的PCI-E供电线路才能工作。
  以往的显卡对周边设备的要求可没这么夸张,一台峰值功率500W的电源就可以稳稳的让中高端产品正常工作,那时候的产品也不需要特殊的机箱才装的下。现在的这些怪兽们,想要用起来,大功率电源必不可少,大尺寸机箱也是必须的。虽说好马配好鞍吧,但这些显卡本身就比较贵了,现在这种设计无疑大幅度的提升了用户购买显卡后的附加成本,对那些打算升级的用户来说,追加投入也要比原来大得多。这一点实际上是值得显卡厂商考虑一下的——到底有没有必要为了产品卖点而把显卡做的那么夸张。
  
  ASUS EAH6950 DCII
  
  ASUS这款采用Radeon HD 6950显示核心的产品,实际上是属于ASUS Direct CU II系列产品中的一款,而Direct CU II则是ASUS为中高端显卡配备的特殊散热设计。其主要特点是内部集成3条铜质内循环热管,三条热管连接起两块铝制散热片,其中一块用于GPU、显存散热,而另外一块则位于供电电路上方,为供电部分提供散热。两块散热鳍片上放装有两颗大口径低转速散热风扇。
  配置方面,这款产品将核心频率提升到了810MHz,高于标准的800MHz,并且配备了2GB GDD R5显存,整体配置明显高于AMD的官方配置。供电方面,这款产品使用的是ASUS特殊的超合金供电模块,在稳定性和使用寿命上拥有更好的表现。这款显卡需要1条8pin供电线路及一条6pin供电线路才能工作。此外,这款产品支持AMD的Eyefinity技术,提供了4个Display Port接口及2个DVI接口,并且可以切换DVI接口的状态(单路或双路输出)。
  从测试成绩来看,这款产品的表现还是相当不错的,并且满负荷工作状态下的温度也比较低。不过由于提供的接口较多,并且散热器本身也十分巨大,这款产品的外形十分夸张,需要3个扩展背板位才能安装,一般的主板上与PCI-E 16x接口相邻的PCI及PCI-E低速插槽基本上就不能使用了。
  
  ASUS ENGTX 580 DCII
  
  从命名上不难看出,这同样是一款采用了Direct CU II散热系统的显卡产品,不同之处在于这款产品使用的是NVIDIA的旗舰级产品——GeForce GTX 580。Direct CU II是ASUS为中高端显卡配备的特殊散热设计。其主要特点是内部集成3条铜质内循环热管,三条热管连接起两块铝制散热片,其中一块用于GPU、显存散热,而另外一块则位于供电电路上方,为供电部分提供散热。两块散热鳍片上方装有两颗大口径低转速散热风扇。配置方面,这款产品将核心频率提高到了782MHz,搭载1526MB GDDR5显存,采用华硕独特的超合金供电模组。显卡本身需要2条8pin供电线路才能稳定工作。从我们测试的情况来看,一款标称功率750W的电源是使用这款产品的必要条件。显卡提供1个HDMI接口、1个Display Port接口,以及两个DVI接口。
  从测试成绩来看,这款显卡毫无疑问是目前最快的单核心显示卡产品之,是本次专题中性能最好的产品。不过由于这款产品使用的散热器十分夸张(同样十分有效),需要3个扩展背板位才能安装,一般的主板上与PCI-E 16x接口相邻的PCI及PCI-E低速插槽将无法与这款产品同时使用。
  
  ASUS ENGTX 560 Ti DCII
  
  虽然同样使用了ASUS的Direct CU II散热系统,这款采用GeForce GTX 560 Ti的显卡产品的散热系统就要小的多了,而且其PC B版的长度也要短小一些,比较适合大多数机箱使用。在散热结构上,ENGTx 560 TiDCII的散热器同样由3条铜质热管及两块散热鳍片组成,但ENGTx 560 Ti DCII所使用的散热器鳍片尺寸要小一些,也更薄一些。
  基本配置方面,这款产品的核心频率为900MHz,Shader频率1800MHz,配备1GBGDDR5显存,显存频率为1050MHz。作为一款面向中高端市场主打性价比的产品,这款ENGTX 560 Ti DCII并不需要特别夸张的供电系统,只需2条6pin附加供电就能稳定的运行。当然供电模块部分,ENGTX 560 TiDCII仍然使用的是ASUS特有的超合金供电模组,稳定性毋庸置疑。
  测试成绩方面,这款产品的表现算得上是中规中矩,稳定性和温度控制的也相当不错。由于我们的测试均在超高设置下完成,所以对于大多数用户来说,这款产品的性能足以应对绝大多数应用环境,即便是最新的Crysis 2也可以轻松流畅的运行,同时还可以保证相当不错的画质。
  
  GIGABYTE GV-56GOC-1 GI
  
  GV-56GOC-1 GI是一款基于技嘉的Ultra Durable VGA设计标准设计制造的显卡产品,用料可以说是相当考究。这款产品使用的是2倍铜PCB版,供电部分使用的电容全部是日产固态电容。散热方面,这款产品使用的是技嘉的WindForce散热系统,搭载4条热管及一整块铝制切割鳍片散热器,散热器上方配备了2颗10cm口径的低转速散热风扇,在保证风压的同时确保噪音最小。
  配置方面,这款产品基本上是按照NVIDIA的官方规范来设计生产的,搭载的显示核心为GeForce、GTX 560,是一款面向主流市场的显卡产品。其核心频率为850MHz,显存频率为1002MHz,配备1GB GDDR5显存。输出接口方面,这款产品提供了2个Dual Link DVI接口,以及1个Mini HDMI接口,以便满足用户连接多个显示设备使用。
  测试方面,这款产品的表现还是相当不错的,尤其是稳定性值得称道,而噪音表现也让我们颇为惊讶,在完全开放的测试平台上,基本听不到来自显卡风扇的噪音。作为一款面向主流的产品,这款产品的尺寸合适、性能足够,价格也比较合适,不到1500元的售价让这款产品更易被用户接受。
  
  MSI R6970 Lighting
     首先,这是一款基于AMD的顶级GPURadeon HD 6970核心的显卡产品,可以说是目前最快的显卡产品之一。其次,这款产品的外形绝对会让你过目不忘,其长度达到了相当夸张的地步——普通机箱跟本不要想装进去。而且基于微星Twin Forzr Ⅲ散热结构,这款产品的散热器重的吓人。内置4条热管,搭配全长的切割鳍片散热器,配备两颗大口径散热风扇,使得这款产品的PCB需要使用特殊设计的钢梁连加固。再加上全钢的外壳,让这款产品拿在手里分量十足。
  配置方面,基于如此强大的散热器,不超频似乎也有点说不过去。于是这款产品将标称的880MHz主频提升到了940MHz,并且仍然工作的很稳定。显存方面,这款产品的显存容量仍然为2GB,显存频率为1375MHz。输出接口方面,这款产品提供了2个DVI、1个HDMI,以及两个Mini DisplayPort,并且全部接口均采用镀金设计,可以说是相当奢侈。
  测试成绩方面,作为AMD的顶级单核心显卡,这款产品的表现相当出色,而且温度控制的相当不错,噪音也很小。从这几方面来看,这的确是一款值得发烧友考虑的产品,只不过,伴随这款产品用户还需要搭配更为强劲的附加设备才行,比如超大尺寸的机箱,不少于750W的电源。
  
  MSI N550 GTX Ti Cyclon II
  
  微星的这款N550GTX Ti Cyclone II采用的核心是面向主流市场的GeForce GTX550 Ti。从造型上来看,这款产品更接近我们此前比较熟悉的那些显卡。即便如此,这款产品的散热器设计仍然很有特色。内置的2条热管用户给GPU散热,散热风扇被包围在两组半圆形散热鳍片中,两条热管贯穿这两组半圆形散热器,算是相当有特点的设计。
  由于这是一款超频产品,因此在基本规格上与NVIDIA的官方规范有所区别。它的核心频率为950MHz,Shader频率为1900MHz,显存频率为1075MHz,均比官方规范略高。板载1024MB GDDR5显存。作为一款面向主流市场的产品,这样的配置可以说是相当不错。供电方面这款产品仅需1条6pin电源即可工作,因此对用户机箱里的电源没什么特别的需求。
  从测试成绩来看,这款产品的表现在这一档次的产品中还是相当不错的,足以满足大多数用户的应用需求。即便是最新的一些3D游戏,在适当调整分辨率及画质后,也能获得流畅的效果。对于一款不足干元的产品来说,这样的表现已经相当出色了。
  
  七彩虹iGame GTX 560
  
  在以往的专题中,我们就曾测试过七彩虹iGame系列产品。这一系列产品是七彩虹专门针对发烧游戏玩家设计的,力求在价格和性能方面做到较好的平衡——榨干显卡的最后一点性能,用相对低廉的价格提供尽可能好的性能。这一系列产品的最大特色是具有硬件级“一键超频”功能。通过显卡接口背板上的按钮,用户就可以轻松切换显卡的使用状态。而且有意思的是,新一代的iGame改变了该按钮的默认动作,以往是按下按钮进人超频状态,而现在是按下按钮进人标准状态。
  这款iGame GTX 560在Turbo模式下的核心频率为900MHz、显存频率1100MHz,搭载1GB GDDR5显存。散热器方面配备的是内置内循环热管及分体式散热片,搭载一大一小两个散热风扇,整体工作效率相当不错。输出接口方面这款产品提供了2个Dual Link DVI及1个MiniHDMI接口,可以满足用户连接多种显示设备的需求。
  由于这款产品的默认状态就是超频的Turbo模式,所以我们的所有测试都是在Turbo模式下完成的。这款产品的性能表现相当出色,甚至超过了采用GeForce GTX560 Ti的产品,并且稳定性也并未受到超频模式的影响,只是它的噪音略大一些而已。
  
  七彩虹iGame GTX 550Ti
  
  同样是一款iGame系列产品,同样支持硬件级的“一键超频”功能,甚至连散热器设计都与另外一款iGame GTX 560相同,只不过这款产品采用的显示核心是GeForceGTX 550Ti。同样,这款产品的超频设置也是默认状态为Turbo模式,而按下按钮后的状态为普通模式。
  配置方面,这款产品的Turbo模式下,核心频率为900MHz、Shader频率为1800MHz,搭载1GB GDDR5显存,频率为910MHz。前面也提到了,这款产品的散热器设计与另外一款iGame产品基本一致,不同之处在于这款产品还附带了另外一个带有1条内循环热管的独立散热器,这个散热器可以通过预留在显示卡输出接口背板上的圆孔与主散热器组合,将热量直接带出机箱外。
  测试时,我们按照显卡默认的Turbo模式完成了所有测试,这款产品的表现十分出色,其性能基本与GeForce GTX 560相当。这就是iGame的理念所在——投入较少的资金,获取更好的性能。这让七彩虹的iGame GTX 550 Ti在同级别产品中,极具竞争力。
其他文献
本工程地层主要为第四系全新统及上更新统海相及海陆交汇地层,地层土物理力学性能指标相差较大,结合实际施工情况,选用梅耶霍夫经验公式法对地下连续墙成槽过程中的槽壁稳定
期刊
恶性组织细胞病(恶组)系单核-巨噬细胞系统的恶性疾病,临床上并不少见,但恶性组织细胞病和克隆氏病同时并存,较为罕见,国内尚未见报道,现将我们遇到的1例介绍如下。病历摘要
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
老实说,我觉得毕业设计对于当事人,是不必要“评”,也不应该“为评而评”的.rn我喜欢“展览”这个概念,分享.rn喜欢,是说不清理由,也不需要理由的吧.rn看到一个好作业,就好像
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
Warm up or lead in设计一:Let’s do播放上册Unit 6 Let’s do.内容,师生边说边做。Show me 1 and 2.Show me 3 and 4.Show me 5 and 6.Show me 7 and 8.Show me 9 and 10.S
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
加拿大金属钛公司日前建立了一家试验工厂 ,计划从加拿大大西洋沿岸的舒贝纳卡迪河沙滩提取金属钛。此举可能使该公司成为全球生产成本最低廉的颜料工业原料生产厂商。此间媒