英特尔Sandy Bridge 处理器分析测试之五

来源 :计算机世界 | 被引量 : 0次 | 上传用户:X5203344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在上文中,笔者简单介绍了Sandy Bridge处理器带来的AVX指令集及其微架构的革新之处,现在来谈谈Sandy Bridge架构的一个大变动——融合GPU。
  
  CPU与GPU的融合
  
  除了CPU之外,英特尔其实也一直在移动/桌面级平台上提供着GPU产品,如英特尔在MCH北桥集成的显卡也属于GPU范畴。这种芯片组集成的显卡其性能并不怎么强劲,然而胜在便宜,在日常应用中也足够使用了,因此其市场占有率非常高。到了Clarkdale这一代,英特尔开始将GPU部分从芯片组上移出来并放进了整个处理器包装之内,然而由于工艺上的限制,CPU属于32nm而GPU属于45nm,它们实际上分成了两个不同的晶片,只是封装到了同一个基板上,两个晶圆通过QPI通信,由于内存控制器也移到了45nm的GPU封装上,内存延迟和带宽反而受到了影响,这种方式最终得到的性能不佳。
  Sandy Bridge整合的CPU和GPU才是真正的融合,它们不再分成两个不同工艺制程的单独核心,而是完全在设计时就融合在了同一个核心上,并由统一的32nm工艺制造。融合它们的架构正是前面说过的环形总线,GPU直接挂在环形总线上,并和CPU核心一起共享整个处理器的L3缓存乃至内存控制器。
  
  革新的GPU架构
  
  Sandy Bridge新的GPU架构同时瞄准了功耗和性能两个要素,在图形性能上,主要的核心变动就在于EU单元上。
  EU(Execution Units)执行单元和其他GPU的流处理器相对应,运行各种不同的Shader,在Sandy Bridge上被称为Unified Execution Units。
  新一代的EU执行单元增强了面向向量/矩阵的操作性能,提供了zero overhead的线程切换能力。新一代EU还使用了更大的寄存器文件(每线程4KB),可以保存更多的数据,以支持更复杂的Shader程序。此外,新的EU还使用了第二代并行分支算法,即使面对更复杂的状况也能提供高效并行执行能力。Sandy Bridge的新EU还使用了新的超越数学运算引擎,吞吐量提升了4倍到20倍不同,英特尔表示,正弦、余弦操作的速度比现在的HD Graphics提升了几个数量级。
  除了这些之外,Sandy Bridge的新EU还使用了新的、能和图形API ISA达到1:1的指令集,在时钟频率不变的情况下增强了吞吐量。英特尔将采用新一代EU设计的融合显卡命名为HD Graphics 2000和3000系列,这两个系列的不同就在于EU的数量,其中2000拥有6个EU,3000拥有12个EU。标准版本的Sandy Bridge处理器提供的是HD Graphics 2000,只有带K后缀的倍频解锁版本才会提供HD Graphics 3000。
  
  增强的多媒体处理能力
  
  Sandy Bridge的GPU除了图形性能明显提升之外,还有一个重点关注的领域就是多媒体处理上,并且和一般的GPU仅关注解码能力不同,Sandy Bridge同时提供了强大的解码能力和编码能力。其中,编码通过类似Fixed Function的专用单元来完成,这个单元叫多格式解码器(Multi-Format Codec),是一款专用的并行引擎,支持MPEG-2/VC-1/AVC格式。和通常的GPU解码方案不同,Sandy Bridge的解码并不需要使用到GPU EU执行单元,包括VLD/CAVLC/CABAC/IDCT/IT/MC/LF等阶段全部在MFC内完成,功耗表现上更加出色。
  Sandy Bridge的视频编码则使用EU执行单元阵列配合专用的高吞吐量VME(Video Motion Estimator)来完成,并在需要时重用MFC部分(如AVC编码)。此外还有一个专用的色彩处理加速后端来进行STE(增强皮肤色调)、ACE(自适应对比度增强)、TCC(全局色彩控制)等处理,总的来说,Sandy Bridge的GPU提供了一整套硬件的编解码方案,由于效果如此之明显,英特尔还特地使用了一个Quick Sync(高速转码)的术语来形容Sandy Bridge的纯硬件转码能力。
  
  融合之路
  
  面对着独立GPU的强大压力,Sandy Bridge使用了很多种方式去应对,一个是通过AVX指令集和强化的微架构来快速提升CPU的运算能力;另一个就是提升英特尔自己GPU的能力,如果你打不过一个对手,那就加入它。为了提升集成GPU的能力,将CPU和GPU融合在一起就是一个必然的选择。
  融合可以让GPU也使用到英特尔强大的制程工艺。Sandy Bridge的GPU部分使用的是和CPU一样的32nm工艺,而业界独立GPU的制程还停在40nm上,即便是同一个工艺,英特尔也能达到更高的性能。可以注意到,通常独立GPU的核心部分只能运行在数百MHz,而英特尔的GPU则可以达到1.35GHz,更先进的工艺还可以使用更多的晶体管,以及使用更好架构设计。实际上,Sandy Bridge的GPU当中使用到了NVIDIA的专利技术,为此专利以及未来会使用到的其他专利英特尔付出了15亿美元。使用他人的技术也是增强自己GPU能力的方法之一。
  通过融合策略,英特尔将CPU和GPU放在了同一个起跑线上,并使用英特尔强大的制程工艺驱动,这让其立在了不败之地上。下一期笔者将会带来Sandy Bridge的性能测试数据,请看下回分解。
其他文献
在信息化领域,如今有一个比较时髦的词叫“落地”。将云计算落地,将虚拟化落地,在各种场合我们几乎都能够见到这个词。那么,何谓落地?  实际上,在IT产业中,落地这个词所代表的,就是通过具体的工作,将技术落到实处,让其生根发芽,最终推动企业和机构的业务发展。换句话说,也就是将技术转化为应用价值。  现在,这一理念不仅已经贯穿了IT行业,而且也成为了通信行业发展的主旋律。多方通信3.0,就是在落地的概念
同事之间的沟通利用即时通信、电子邮件,员工自带设备(BYOD)上班,平板电脑、智能手机等在办公室里越来越常见??我们进入了“后PC时代”、“全终端时代”。  “统一”的交流方式  思科大中华区副总裁、协作与统一通信事业部总经理李金水以移动化、可视化、社交化以及虚拟化来概括当前“后PC时代”的特点。  思科对“后PC时代”的这种关注,体现在其面向Cisco Unified Communication
日前,云技术服务商广州市品高软件开发有限公司发布了全新版本的云基础架构平台BingoCloud 3.0,并宣布品高在线公有云BingoCC.com结束半年多的内部和邀请测试,正式公开运营。同时,广州地铁和科大讯飞、品高软件分别签订了在各自行业领域的战略合作协议。  “中国的网络环境不及北美等地区,云平台向用户交付的计算能力和网络服务速度需更加细化,无论是网络质量还是交付速度,都不能在现有的基础上给
经过近10年亢奋式发展,中国服务外包界对自我竞争力以及竞争对手的认识开始理性起来。这个心态的切换点与东南融通因业绩造假被强制停牌时间巧合。东南融通于2011年5月17日被纽交所正式调查,同年8月31日被正式解散。一个近万人的科技公司3个月内轰然而落,不可思议的命运转折不禁让国际投资人意识到,中国外包企业与行业需要重新评估,而且也让国际外包业的决策人意识到中国的特殊风险与回报。联系到两年前印度外包业
近日,PMC公司推出了7系列6Gb/s SAS/SATA RAID阵列卡。据PMC公司服务器存储解决方案产品经理Jason Pederson介绍,Adaptec 7系列可直接连接16块固态硬盘(SSD),4K大小数据块随机读操作最高可达45万IOPS,相当于上一代RAID阵列卡性能的10倍,为各种企业及云计算应用提供了性能上的支持。  据悉,Adaptec 7系列采用PMC 24端口的片上RAID
当越来越多的人开始习惯在网上购买衣服、食品、生活用品时,网购家电也逐渐有了越来越大的市场。庞大的网民数量,成为家电网上商城快速发展的土壤。 据了解,目前全国家电类网上商城已超过1000家,由于家用电器产品网购创造了经典的B2C2B模式,使得传统家电企业不再受制于经销商渠道,却得以通过电子商务平台直达最终用户,因此,质优价廉成为消费者选择电器网购的最大原因。  家用电器网购成长过程中的点滴也正在被淘
启明星辰发布万兆产品及解决方案  本报讯 国内信息安全厂商启明星辰近日正式对外发布了天清万兆Web应用防火墙(WAF)及天清万兆防拒绝服务系统(ADM)。根据介绍,本次发布的天清万兆WAF采用了多核架构并行计算体系,能够实现超过10G数据吞吐量的安全防御。  三星GALAXY S Ⅲ I9308在京发布  本报讯 6月6日,三星电子携手中国移动,在北京共同发布三星GALAXY S系列第三代G3版旗
吴玉征 wu_yuzhen@ccw.com.cn  最近读了几篇关于制造业的文章,心中不是滋味。  第一篇文章是中国台湾某代工厂工程师写的。他所在的工厂和台积电、广联达等相似。该人硕士毕业,进入工厂3年后离职。原因很简单:前途无望。在他看来,台湾这些代工厂优势不再,不重视人才。工厂有1000名硕士、200名博士,但在这个群体中,90%的人从事简单、重复性的工作,只有10%的人从事“开发、研究”工作
英特尔终于交出了一份物联网答卷。  11月27日,由北京市、英特尔及中国科学院联合筹备的“中国英特尔物联技术研究院”(简称“物研院”)在中关村正式挂牌成立,这所计划在5年内投资两亿元的物联技术研究院正式投入运营。  根据协议,物研院专门成立了由北京市科委、中关村管委会、海淀区政府、英特尔、中科院自动化所联合组成的指导委员会提供战略指导,并实行双院长管理模式。正式投入运营后,物研院将开发物联网典型应
本报综合报道 10月25日,工业和信息化部就前三季度工业通信业发展情况举行了发布会,工信部党组成员、总工程师朱宏任表示,我国工业经济运行总体朝着企稳方向发展,转型升级稳步推进,通信业发展势头良好。  朱宏任介绍称,前三季度中国工业通信业运行呈现以下特点:一是工业经济运行缓中企稳。其中一季度增长11.6%,二季度增长9.5%,三季度增长9.1%;二是稳增长政策效应逐步显现;三是产业转型升级有序推进,