This is the“K”ing!

来源 :微型计算机 | 被引量 : 0次 | 上传用户:sf45df
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “史上最快、最有效率的GPU!”&“以最低的功耗代价换来最为极致的性能!”——NVIDIA
  凭借28nm先进工艺和全新的GCN架构,AMD的“南方群岛”家族在高端显卡市场上出尽风头。不过,随着研发代号为“Kepler”的NVIDIA下一代显示核心的发布,两大阵营的新一代最强显卡终于棋逢对手。
  显卡性能王位之争,现在才正式开始。
  以彼之道的“小”胜
  桌面“Kepler”首发测试
  从GT200开始,NVIDIA的铁壳封装就再没让我们看过GPU的真身。也是从那时开始,小核心策略成为TAMD反击NVIDIA的一个利器。还是从那时候开始,NVIDIA的产品总能后发制人,长期占据显卡性能王座的位置。这一切显得那么顺理成章,以至于我们从来没有想过NVIDIA会做出一个小巧的旗舰显示核心。事实上,你能想象出NVIDIA设计的小核心会是什么样子吗?它是否还能保持性能上的领先优势?
  在能耗比上是否能后来居上?
  别想了,让GeForce GTX 680来告诉你一切!
  NVIDIA的第一款“小”核心旗舰
  3个月前,AMD发布了基于GCN架构的新一代旗舰显卡Radeon HD 7970。在我们的测试中,它以非常明显的优势战胜了当时NVIDIA的旗舰GeForceGTX 580。在接下来的时间里,玩家们都在等待NVIDIA发布新的产品,届时好对比选择自己的下一块玩物。按当时的推测,新产品要想稳获显卡王位,就必须拥有超过GTX 580至少40%的性能。想必又将是一颗核心面积在500mm2左右的规格怪兽。让大家没有想到的是,NVIDIA为我们准备的“Kepler”架构首款核心(GK104),竟是一颗核心面积不到300mm2的“小”核心。接下来,Mc评测工程师会将GK104的特征划分为基础(计算)特性和功能特性分别进行介绍。其中功能特性将会以夹叙夹“测”的体验方式为你展现。
  
  除了更新Polymorph Engine引擎,以提高GK104芯片上单位面积的计算性能。NVIDIA的工程师还优化了GK104上的基础计算架构,以期达到在尽可能小的芯片内塞进更多计算核心的目的。如果你稍微留意过GF110的SM构成,你会发现“Fermi”的每个sM的内只有32个CUDA核心,也就是说SM内的一套逻辑控制单元只管理32个核心的工作调度。而GK104上,这个比例被放大到了192个。降低逻辑控制单元和指令发射器的比例,用较少的逻辑单元去控制更多的CUDA核心。从这个层面上来看,NVIDIA似乎借鉴了AMD经典的SIMD架构设计思路。有趣的是我们之前分析GCN设计构思时,发现AMD才大刀阔斧的改进了SIMD,向“Fermi”的MIMD架构靠拢。不管怎么说,拜这种思路所赐,GK104的流处理器数量(CUDA数量)达到惊人的1536个,在晶体管数量增加不到18%的情况下,将流处理器数量增加到了GF110的3倍。
  此时相信有读者会担心“降低控制单元的比例那是不是意味着NVIDIA从G80开始赖以成名的高效率将一去不复返?”理论上,肯定会导致效率下降,但真实情况是效率下降的问题并不严重。而这多亏了指令调度的“软”着陆。事实上,NVIDIAI程师发现线程的调度有一定的规律性,编译器所发出的条件指令可以被预测。在“Fermi”及以前,这部分工作是由GPU内专门的硬件单元来完成的。而在GK104上,这部分工作将根据预测性,交由简单的软件程序来处理。这样就能节约不少晶体管,简化CUDA单元,简化控制和调度单元的硬件设计。不过我们担心由此开始,N家的显卡也将出现比较明显的软件优化依赖,驱动或游戏的优化不到位将会明显影响“Kepler”架构的发挥。
  为了能耗比,频率不再分家
  细心的读者可能已经从表1中看出GTX 680的规格中不再单独列出Shader频率,这是怎么回事?按照NVIDIA的说法,从G80时代开始采用的异步Shader频率设计是为了能在尽量少的芯片面积下实 现更高的吞吐量。但这是以牺牲功耗为代价的,这种设计需要2倍于同步频率的流水线硬件,和双倍的重定时功耗。每个硬件单元的耗电最高会达到4倍于同步频率的水平。现在,“Kepler”的设计改变了以往架构流处理数量明显不足的劣势,没有必要再沿用这种高功耗的设计。毕竟“Kepler”的目标不仅是提高性能还更注重能耗比。
  解除绑定,让纹理质量向极致靠拢
  
  1920X 1080是当前大多数玩家使用的分辨率。在这个分辨率下,GTX 680能轻松压制住上代旗舰——GTX 580。基准测试中,它的领先幅度超过了我们之前预期的40%的心理底线。但是实际游戏中这个幅度又有所打折。特别是在面对开启抗锯齿的压力环境下,GTX 680相比GTX 580的领先优势会大幅下滑。这显然是受到了显存位宽和光栅单元减少的负面影响。总的来说,这次换代的性能提升幅度,勉强满足了用户的期望。
  相比HD 7970,GTX 680领先还是毋庸置疑的。从表2中你能看到,GTX 680的游戏性能平均领先HD 7970约12%,看似和基准测试极为吻合。不过仔细查看数据你会发现,在《异形大战铁血战士》、《地铁20339以及《使命召唤:现代战争3》中,两卡的性能其实大致处于一个水平线上。而在另外几款游戏中,GTX 680的领先优势又明显超过了平均值。看来我们对“Kepler”软件依赖性的担心并非多余。相比“Fermi”(GTX 580),“Kepler”(GTX 680)在不同游戏中的表现更加不稳定。不过,换个角度看,这也许是“Kepler”的一个优势。毕竟它能通过软件(如驱动)的后续优化,获得更大的性能提升。
  面对自家的上代双芯旗舰GTX 590时,GTX680的情况和HD 7970面对HD 6990时一样。在部分游戏中GTX 680有匹敌、甚至超越GTX 590的表现。但大部分游戏中,GTX 680还是明显落后,单拳实难敌双手。
  2560分辨率谁是真卡皇?
  坦白说,对于GTX 680和HD 7970这样的顶级显卡,1080p分辨率已经不足以构成渲染压力。超过100的最低帧数让测试变成了纯数字的比拼,此时我们已经感觉不到游戏体验的变化。所以,MC评测工程师决定将游戏分辨率提升到2560X 1440的高度。在这个分辨了下开启全特效运行大型3D游戏,几乎能榨干显卡的计算性能。谁能顶住这个压力成为新一代卡皇,获得顶级玩家的青睐?
  在这个分辨率下,所有参测显卡的测试成绩都较1080p时大幅下滑。GTX 680基准测试的GPU成绩下滑59.5%,下滑幅度比HD 7970的56.5%更严重。游戏实测的情况和基准测试比较吻合。GTX 680和HD7970的平均帧率都大幅下滑,GTX 680相比HD 7970的领先优势较1080p分辨率有所降低,但整体依然胜出约7个百分点。很显然,GTX 680再胜一局,新一代的卡皇非它莫属。但不得不说的是,在这种高分辨率下,即使是GTX 680也会在部分游戏中失去可玩度,平均帧数达不到30帧。从这个角度看,不论是A家还是N家,顶级单卡都不足以满足高端玩家的需求。顶级多卡并联才是高端用户的新追求。那GTX 680 SLI系统的并联效率如何呢?让我们这就来一窥究竟。
   中的表现较为出色,相对单 卡系统平均帧率提升非常明显。虽然整体不及基准测试的领先幅度大,但在将测试分辨率拔高到2560×1440高度的时候,SLI系统的效率就能很接近基准测试体现的情况,游戏平均帧率相对单卡系统几乎翻番。此外,MC评测工程师注意到,新架构下的SLI系统并未能完全解决并联计算的最低帧率倒退问题。在我们的测试中依然偶有SLI系统最低帧率不及单卡系统的情况发生。所以我们建议,只是希望在1080p分辨率下畅玩游戏的玩家,性能强劲的GTX 680单卡就已经能够满足你的需要。但已经沉迷或即将被高分辨率呈现的精美画质所征服的玩家,请义无反顾的组建SLI吧。能在2560×1440这种分辨率下畅玩《战地3》这样的画质党游戏,确实是一种享受。
  通用计算
其他文献
GeForoe GTx 460显卡上市后,由于其超频后令人满意的性能增幅,很多玩家都将它长期置于超频状态下使用。然而目前GeForce GTx 460显卡公版产品只设计了三相供电,在超频状态下长期使用时,一些玩家发现供电部分温度较高。而另外一些玩家的GeForee GTx 460显卡超频能力则并不出色,只能在820MHz~850MHz左右徘徊,无法在900MHz下稳定运行。这就出现了两个问题:1 
我对3D立体的感受来自于早期的立体电影,在很小的时候就去立体电影院看过立体电影。和现在不一样的是,当时的立体电影院非常少,只有部分大城市才有一两个。影片也多是一些为立体电影专门拍摄的影片,内容大多是纪录片或者无聊的故事片。即使如此,其逼真的效果还是给我留下深刻的印象。当时的3D立体电影院和现在没有本质的区别,都是两部放映机,采用偏振眼镜。非要说区别的话,那就是现在的立体电影充满了电脑制作的元素;电
生活,怎么就碎片化了?  还记得在我高中时,也就是上个世纪90年代上半段,生活似乎并不像现在这样琐碎。学习、吃饭、看电视、和朋友一起聚会玩乐……这些生活方式都很简单,非常有规律。在那个年代,我们的时间是块状的,没有很繁杂的事情来打断你,你也不可能随时随地获取各种不同的信息。我们的设备也是专用的,电视机就是晚上主要的娱乐工具;书籍就是我们获取知识的最主要渠道;手机,嗯,这是有事儿的时候才会用到的高端
AMD新近发布的APU毫无疑问是目前最受关注的硬件平台之一,对于这款具有革命意义的产品,我们也很想看看到底谁能成为第一个吃螃蟹的人:是已经正式发布APu机型的索尼惠普和富士通?还是其他正在摩拳擦掌的系统厂商?让我们有些意外的是,惊喜来自微步。  是的就是那个拥有强大主板研发能力的微步,只不过这一次,微步展现实力的舞台不再是他们拿手的主板,而是更加系统化的13英寸轻薄笔记本电脑:WB-U3T-352
从外观上看,这款金邦黑龙DDR3 1333笔记本内存与普通笔记本内存类似,采用8层PCB、双面16颗粒设计,每颗内存颗粒的容量为12BMB,组成了单根内存总共2GB的容量。它选用编号为XDR628A36-P采用FBGA封装的金邦自编号颗粒,该颗粒额定工作电压为1.5V,具有低耗电、低发热的特点,在DDR3 1333频率下的默认延迟为9-9-9-24。与普通内存不同的是,这款内存贴有醒目的“DBT
作为一名主板业者,我能明显感受到,最近几年市场的增长点已经转移到了消费电子产品上,而传统的台式PC与DIY配件的关注度看起来在大幅降低。作为台式机PC配件的核心载体——主板产业的未来之路又通往何方?  如今PC产业已经走过了初期快速发展的阶段,逐渐走向成熟。由于芯片制程的提升,导致整合度越来越高、功耗越来越小性能也越来越强劲,使得计算机的体积可以越来越小,从而移动设备越来越多,使用率也越来越高。不
在AMD显卡率先迈人40nm制程工艺后,NVIDIA也不甘落后,于近日推出了基于40nm制程工艺的GeForce GT 220。微型计算机评测室也在第一时间收到了名为七彩虹GT220-GD3 CF黄金版512M N12(以下简称“GT220-GD3”)的GeForce GT 220显卡,并进行了测试。NVIDIA推出GeForce GT 220的目的是替代GeForce 9500 GT,主打399
键盘按键失灵和鼠标跳帧是本次《微型计算机》键鼠领域售后服务消费者满意品牌调查中投诉最多的两个故障。为何它们频频发生?消费者遭遇这类故障后该如何解决?本文将为消费者带来答案。    本次《微型计算机》键鼠领域售后服务消费者满意品牌调查结果中显示,键盘按键失灵和鼠标跳帧成为投诉最多的两个部分。其中遭遇键盘按键失灵占36.2%,遭遇鼠标跳帧的占26.9%。一般用户遇到的键盘按键失灵有两个现象,一是卡键,
一、好看还实用—3D BIOS  主板的BIOS撑着它那副单调、乏味的“脸面”,数十年如一日,是否已让各位用户感到了审美疲劳?看看3D BIOS吧,或许它能给你不一样的感受。3D BIOS是技嘉X79主板的招牌特色,它将主板的超大“靓照”作为操作界面,用户的鼠标移到主板的某一部分,那一部分就会亮起,并对用户进行功能提示。想调节主板功能,只需点击主板相应的模块即可。比如,想调节处理器主频,直接点击处
从双核处理器的面世开始,处理器比拼的关键指标就由频率变成了核心数目。从双核到三核,再到如今四核也开始挺进主流市场,无—不是核心数目至上的体现。谁能够在核心数目上压倒对手,谁就能够得到大众的认可。早在去年8月,AMD就发布了“Istanbul(伊斯坦布尔)”六核处理器。这也是全球第一款六核处理器,引起了业界的高度关注。如今,AMD又将六核架构导人到桌面市场,代号Thuban的六核处理器已经蓄势待发。