合二为一,“智”高“视”远

来源 :微型计算机 | 被引量 : 0次 | 上传用户:a7343022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  8年前,迅驰平台的成功推出一举奠定了英特尔在移动领域的霸权。
  3年前,迅驰2一呼百应的气势显示了英特尔在移动领域难以动摇的地位。
  1年前,新鲜出炉的2010酷睿i7/i5/i3系列处理器几乎横扫了大江南北。
  今天,当把GPU和CPU合为一体的Sandy Bridge问世后,它是否能够延续前辈的辉煌,在历史的滚滚车轮中书写属于自己的篇章,还是如同这个行业中无数的名字一样消失在尘土之中?接下来,请与《微型计算机》评测室一同,率先见证这个历史时刻吧。
  Huron River平台技术亮点解析
  
  按照惯例,代号为Huron River的英特尔新代移动平台主要由几个部分组成:代号为sandy Bridge的处理器,代号为Congar Point的芯片组,以及Rainbow Peak、Taylor Peak和Kilmer Peak三款无线网络模组。
  
  GPU与CPU的完美融合
  
  代号为Sandy Bridge的处理器无疑是名气最大的。这款处理器是继英特尔Westmere之后的第二代整合GPU的处理器,它将GPU完全融合到了处理器设计中,在外观上回归到传统的单晶片模式。英特尔也把这种创新性的结构命名为“核芯”显卡,与之相比,Westmere将GPU和CPU分开设计的双晶片模式只是历史长河中的昙花一现。
  由于完全融合到一起,它的晶体管数量达到了9.95亿个。无论是CPU部分还是GPU部分均采用了32nm工艺制造,这比前一代GPU核心采用45nm工艺有所进步。即便如此,Sandy Bridge的核心面积依然达到了214mm2。从英特尔公布的官方照片来看,硕大的核心晶片极为醒目地位于基板表面。在半导体行业中,核心晶片面积越大,产品的良率越难提升,任何微小的瑕疵都将导致处理器报废。这也就不难理解在上一代产品中,英特尔为何未将GPU和CPU融合在一起了。毕竞,在新工艺刚开始应用时,良率本身就处于一个调整阶段,再贸然加入更多功能导致核心面积大幅增加,质量问题恐怕将会是个巨大的噩梦。
  合二为一,说起来简单做起来难。为了提高运行效率,英特尔在Westmere架构的基础上进行了大幅的改进,以使CPU和核芯显卡能够更加和谐地运行。为此,英特尔在Sandy Bridge中引入了环形总线结构,将CPU核心、核芯显卡及其他功能模块分列于三级缓存周围,每个功能模块均通过环线总线与共享的三级缓存相连。从而大大降低了访问缓存的延迟,提升了数据吞吐带宽。另外一个优点则是核芯显卡也借此实现了对三级缓存的直接访问,而不必事无巨细均绕道访问速度慢得多的内存,显然也有助于性能的提升。
  
  
  说了这么久的核芯显卡,它的正式命名为Intel HD Graphics 3000。它的架构与Westmere所采用的Intel HD Graphics相同,同样支持DirectX 10,并包含了12个统一架构的Eu执行单元。不过,它拥有更大的寄存器文件,并通过第二代并行分支提升了执行并行任务与复杂着色指令的能力,其单位时间指令吞吐量比上一代产品提升了一倍。
  
  睿频加速2.0,智能计算的关键
  
  早在Nehalem架构中,英特尔就开始提出“按需计算”的概念。在这个方向的指引下,英特尔的工程师们着力在多个方面解决这个问题,睿频加速的雏形就是在这个时候形成。而在Westmere架构中,睿频加速技术得到了进一步的发展,频率提升的幅度更大,操作也更加智能。
  与以往相比,Sandy Bridge的睿频加速2.0有几个主要的变化:首先,根据型号的不同,睿频加速2.0提升的频率分别达到了700MHz~1.1GHz,最高可以达到3.5GHz的单核心运行频率。其次,在以往的睿频加速中,无论如何加速,都需要保证实际功耗不高于TDP设计功耗。而在睿频加速2.0中,这个界限首次被打破。换言之,如果应用需要,睿频加速2.0有可能会提升所有核心的频率,使之在短时间内超出TDP设计功耗,此时,系统仍然可以稳定运行。这在临时运行某些计算密集型应用时尤为有用。以2.3GHz的酷睿i7 2820QM为例,它甚至可以在四核心同时运行时将频率提升到3.1GHz。不过,这一功能并不是所有型号都具备。第三,以往的加速仅包含对CPU的加速,并不包括集成GPU;睿频加速2.0则将核芯显卡包含到加速过程中。核芯显卡能在对图形性能要求苛刻的游戏或软件应用中自动提高频率,从而增强性能,此时处理器核心则会适当降频。借助睿频加速技术,处理器核心和核芯显卡能够自动分配性能。例如,软件需要更多CPU资源,那么CPU就会加速,同时GPU减速,反之亦然。
  此时,核芯显卡的频率可由默认的650MHz迅速上升到1350MHz,频率提升幅度达一倍多!目前,移动市场主要的入门级显卡GeForce 310M和ATI Mobility Radeon HD 5470的核心频率分别为1530MHz和750MHz。至少从规格上,英特尔的核芯显卡已经具备了取代入门级独立显卡的能力。实际的状况如何?不要着急,稍后我们就会来解答这个问题。
  Sandy Bridge也同样继承了优秀的电源管理技术,以达到按需降低功耗的目的。现在,它的三级缓存也已经与CPU核心同步,在需要时可以降频工作以降低功耗。在Westmere架构中,处理器集成的GPU由于采用了45nm工艺,能耗不容忽视。Sandy Bridge通过融合及工艺升级的手段大幅降低了功耗。再加上针对多线程应用的超线程技术,SandyBridge能够保证在任何时候都在性能和能耗之间实现最优化的表现,英特尔把它称为“智能”处理器是完全能够站住脚的。
  
  核芯显卡够给力
  
  除了封装形式改进,以及睿频加速2.0所带来的性能及功耗上的优势,核芯显卡在功能和特性上也添加了许多全新的功能,使得核芯显卡的功能更为广泛。
  作为核芯显卡的第款产品,Intel HD Graphics 3000具备高速视频同步技术(Quick Sync Video)。英特尔通过在核芯显卡内置入MFx并行引擎,为核芯显卡增加了H.264和MPEG2的硬件编码功能。当针对这几种视频进行视频格式转换时,高速视频同步技术将显著降低处理器占用率,并大幅提高编码速度。
  直以来,3D显示这个近年来最为热门的话题之一似乎都和英特尔没有什么关系。核芯显卡终于赶上了时代,HD Graphics 3000新加入的引触3D视觉技术(InTru 3D)使它具有了蓝光3D MVC硬件解码功能,并支持HDMI 1.4,从而使英特尔平台实现了对1080p立体3D蓝光的支持。再加上用于为H.264/VC1/MPEG2高清视频硬件加速的Intel Clear Vide HD,使用核芯显卡的用户完全可以体验到丝毫不逊于独立显卡平台的高清视频应用体验。
  
  暗藏玄机的AVX指令集
  
  英特尔在Sandy Bridge中引入了一个全新的指令集,即AVX指令集。从数目上看,这个指令集仅有6条。然而,仔细分析后,现在看似不太起眼的AVX指令集的背后其实凸显了英特尔的野心所在。
  AVX指令集,即Advanced Vector Extensions,字面的意思是高级矢量扩展指令集。它主要针对密集型浮点运算,3D游戏、CAD/CAM、数字内容创建等应用是这类计算的代表。在浮点计算性能增强的同时,AVx也沿用了现有的MMX/SSE指令集。不过它从指令格式上就发生了很大的变化,与以往的扩展指令集有明显区别。可以这么说,AVX并不是x86 CPU的扩展指令集,而是可以实现更高的效率,使SSE指令接口更加易用,并且也有着足够的扩展空间。换言之,英特尔试图通过AVx来摆脱传统x86架构的不足。
  AVX支持256位矢量计算是其最具革新的设计部分,同时也代表了指令编码格式的变更。自1999年SSE将矢量处理能力从64位提升到128位后,直到如今,SSE系列指令集都只能支持128位矢量计算。AVX则开创了一个全新的格局,理论上最高可以将每秒浮点操作数提高一倍。另外,AVX还使用了新的256位函数,在操作和排列中效率更高,存取数据速度更快。不过要使用AVX指令集,需要CPU在硬件上做出改变。为此英特尔为Sandy Bridge核心增加了多个256位端口,用于处理AVX指令,浮点寄存器也彻底更改为256位,保证AVX指令的全速运行。AVX编码格式的另外一个重点就是有着强大的指令集扩展支持,对于同样命令长度的指令也更加容易实现,这样就使不断增长的命令兼容需求变得更加容易。加上Sandy Bridge所带来的融合了乘法的双指令支持,从而可以更加容易地实现从256位向512位乃至1024位的扩展。不过,目前暂时没有软件与操作系统可以支持AVX指令集,只有等到Windows 7 SP1发布以后,我们才能逐渐体验到AVX的强大威力。AVX扩展指令包含了SSE指令,这也有助于像AVX时代的过渡。日前在SSE和AVX格式之间虽然需要进行编译转换,但并不绝对。同时,出于整体的考虑,英特尔对于AVX的普及并不会太过迅速,并且也不会立刻停止SSE时代。
  
  
  除了现实意义,更加重要的是,AVX的编码系统解决了x86架构在解码能力上的不足,从某一侧面上反应了英特尔处理器今后的进化趋势。目前的x86架构为了增强长命令而增设的缓存,使fetch命令长度更长,加上RISC架构的命令格式,命令长度难以缩减;并且,更加复杂的命令格式也由此产生。虽然可以改进解码能力,但x86架构必须以牺牲资源为代价,同时也带来了电力的额外消耗。因此,在改进硬件设计的同时,必须要改进指令格式本身。AVX指令集自然是最行之有效的手段。AVX使得浮点运算能力加强,不光提升了3D游戏,还可以更有效地支持矢量图形,如更复杂的flash显示,更快的SVG(可伸缩矢量图形)支持,更好的HTML5效果等等。与GPU加速相比,AVX几乎不会增加功耗和晶体管,成本要小得多,算是英特尔对不断侵蚀CPU领域的GPU通用计算作出的回应。事实上,一直迟迟未能面世的“Larrabee”处理器也会采用AVX指令集,这就不难勾勒出英特尔对AVx所寄予的厚望了。
  
  芯片组的新特性
  
  与sandy Bridge处理器搭配的芯片组则是代号为“Cougar Point”的HM67芯片组。作为桌面6系芯片组的移动版本,HM67也支持PCI-E 2.0总线,这就意味着它的PCI-Ex1通道将具备单向5GT/s(500MB/s)的带宽。HM67总共提供了8条PCI-Ex1通道,并且可以将多条x1通道灵活配置为x2或者x4通道。
  与桌面版样,HM67将支持14个USB 2.0接口。稍微有些遗憾的是,USB 3.0仍要等到下代产品才会得到支持,目前高端笔记本电脑多通过第三方芯片的方式对USB 3.0予以支持。不过,HM67提供了2个SATA 6Gb/s接口,另外还包含6个SATA 3Gb/s接口。
  Huron River移动平台除了继承了上代Calpella平台的几种无线网络模组外,还新加入了RainbowPeak,无线模组。由此,Huron River平台包含了多种不同定位的无线网络模组。自从英特尔放开对移动平台的无线模组限制后,第三方厂商凭借几乎不相上下的性能和更低的价格迅速在市场上成为了主流。英特尔则改变了相应策略,从以往的强行搭配变为以更为丰富的应用模式来吸引笔记本电脑厂商的采用。Huron River也支持WiDi,无线显示技术,利用无线网络来传输视频信号。
  Huron River平台性能体验
  我们在第一时间获得了英特尔提供的两台基于Huron River平台的笔记本电脑工程样机。17英寸的样机搭配了酷睿i7 2820QM四核处理器,并搭配了英特尔的SSD,代表了Hu ron River平台的最强性能表现。14英寸的样机则搭配了酷睿i5 2520M,代表了主流定位产品的性能表现。两台笔记本电脑的主要配置如上表所示。作为对比,我们也在上
  代产品中选择了两款与之相当的产品进行对比,分别是酷睿i7 820QM和酷睿i5 520M。
  
  CPU子系统测试
  
  先来看看专门针对CPu部分的测试,我们在这里主要选择了专门针对CPU测试的软件,包括clNEBENCHR11.5、SiSoftwa re Sandra 2011C以及3DMark Vantage的CPU测试来对比新旧CPU的1生能。需要说明的是,为了突出CPU测试,我们选择的是对GPU压力较小的3DMark Vantage的Entry模式。
  在这几项专门针对CPU的测试中,基于Sandy Bridge架构的两款处理器比上代产品有较为明显的提升。可以看到,CINEBENCH R11.5的性能提升大致在倍左右。在3DMark Vantage的CPU测试中,新一代处理器的得分已经非常接近上代处理器与GPU加速混合的水平了。而在偏重理论测试的SiSoftSandra 2011C中,差距更加明显。尤其在加密解密测试中,新代产品也有相当出色的表现,比不支持AES指令集的产--品有明显的提升。
  
  GPU子系统测试
  
  在加入了新工艺和诸多新技术的保驾护航后,大家定对英特尔的核芯显卡(即Intel HD Graphics 3000)的性能有所期
其他文献
女生通常都比较喜欢小巧玲珑、外型可爱的移动电源,而男生则通常就比较喜欢大气硬朗、极简风格的移动电源。本期带来的这款昂达V900就是一款具有极简金属风格的移动电源,非常适合喜欢极简主义的用户使用。  昂达V900采用了银白色的金属外壳,外壳采用Unibody一体铝材,外壳边缘通过CNC精工切割,并采用磨砂工艺,相比拉丝工艺更具手感。在冬天摸上去略带一丝寒意。V900的外观造型圆润,与小米的5200m
不可否认,智能手机与平板的日渐普及多少影响到导航仪的销售,特别是中低端产品,不过这也促使导航仪品牌将更多的功能以及更人性化的设计带到这类产品上。今天我们要体验的Garmin佳明nüvi 50,正是一款价格在千元以内,但却将Garmin佳明各种特色功能一网打尽的产品。  让我们通过使用nüvi 50进行一次完整的导航过程来体验它的特质吧。我用吸盘式支架在前挡玻璃上固定好nüvi 50,将外接电源插头
华硕ROG游戏PC一直以来主攻高端市场,继推出低配版的ROG游戏本G550JK之后,华硕在中低端游戏PC领域持续发力,近期又推出了面向更广泛适用人群的入门级游戏本飞行堡垒系列FX50J,我们这一期的主角便是它。  目前,市售的热门游戏本在配置方面,并没有体现出很大的差异。随着市场成熟度提高,产品出现同质化可以说不可避免。FX50J配备了IntelCore i7-4710HQ四核处理器,这是一款关注
传统多媒体音箱多以方方正正的箱体为主,偶尔有创新也都是在外观方面进行修改,很少会去改变箱体的形状。而耳神近日推出的一款圆型结构2.1音箱ER2062,不论是低音炮还是卫星箱都将圆的设计理念发挥到极致。塑料白色箱体几乎找不到一处棱角设计,加之体积小巧,不管是搭配台式电脑还是搭配笔记本电脑使用都不会显得突兀。  ER2062的低音炮使用了4英寸的低音单元,并将低音单元朝向地面,这种对地增压式设计不仅可
坦率地说,多卡互联早已不是什么新鲜事物。从双卡到四卡,《微型计算机》进行过大量测试。就工程师的测试结果上看,无论是装机成本还是效率的提升幅度,双卡互联都是其中最值得主流用户选择的方案。由于在过去的大部分双卡测试中,我们基本都是以HD 6970、GTX 580这样的旗舰为主,因此对主流用户实际组建的指导意义有限。对DIY发烧友来说,玩转双卡互联早已轻车熟路;而普通用户或游戏玩家,他们对双卡互联却充满
组建一台小型化、个性化、高性能的“小钢炮”游戏主机是很多玩家的追求,或许是有鉴于此,在去年美商海盗船推出了卧式薄型机箱BULLDOG。那么问题来了,这类迷你高性能主机如何应对处理器散热问题?毕竟常见的风冷、水冷散热器由于高度和结构等原因难以安放在该类机箱内。这时,在散热性能和“占地面积”之间取得良好平衡的海盗船Hydro Series H5 SF水冷散热器应运而生。  H5 SF是一款低矮造型水冷
在进入固态硬盘行业的第三个年头,影驰终于推出了采用自主研发主控的GAMER系列固态硬盘。它采用了由影驰与JMicron智微科技联合研发的“Heracles”海格力斯主控芯片。从目前泄露出来的消息来看,该芯片为4通道架构设计,内置一颗支持ARM9指令集的32bit嵌入式处理器,其每条通道可同时写入的Die数量从以往的4颗提升到8颗,因此它拥有最高同时并行写入32颗Die的能力,达到8通道主控的性能标
引爆极致性能  Haswell-E平台不仅拥有强劲的处理器多线程运算性能,如其配套的DDR4内存能在高频率下稳定工作,那么借助可超CPU缓存频率的X99主板,它更能为用户带来远超DDR3的内存性能。接下来,我们就将为Haswell-E玩家介绍两款具备较强高频工作能力的DDR4内存新品。
对于希望提升手机、随身音频播放器等手持设备的音质,扩大适配耳机范围的用户,大多会购买一台便携式耳放与之搭配。来自创新的Sound Blaster E5就是能满足这一需求的产品。  E5是个可玩性很高的设备,这是因为它不但能够“捆绑”手机等手持设备起到便携耳放的作用,还可以通过USB接口与PC等设备连接,作为外置声卡使用,也就是说E5是集合了解码与耳放功能于一身的便携式设备。说到便携,E5确实做得不
如今,喷墨打印产品的售价已经相当平易近人,入门级产品更是低至500元以下,购买这类产品对用户来说毫无压力。用户的注意力开始由机型售价转到耗材成本上,为此,厂商接连推出墨仓式打印产品以应对这一需求。以激光打印产品为主的兄弟也加入了墨仓阵营,一口气推出包括兄弟DCP-T500W在内的4款内置墨仓式彩色喷墨多功能一体机。相同的墨仓概念,不同的设计,兄弟DCP-T500W的表现又会如何?  喷墨打印产品之