并行计算方兴未艾 非x86处理器将再度繁荣

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:julyanjust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  
  作为准入门槛最为高昂的一类产业游戏,微处理器的最新技术和发展趋势总是最吸引人们眼球的话题。从去年开始,在过去数年中一直被x86处理器在市场出货量方面节节进逼的RISC和EPIC(即采用超常指令字符集的非x86)架构处理器却呈现出一种复兴的态势,尤其以ISSCC2008大会上发布的IBM的Cell第三代处理器、Sun的Rock和Niagara3处理器,以及Intel代号为Tukwila的最新安腾处理器最为抢眼。
  
  多核多线程
  非x86架构优势凸显
  众所周知,从2003年以来,基于x86架构的Opteron和Xeon处理器在性能上不断提升,给予了RISC和EPIC架构处理器以极大的压力。而高昂的研发成本和不断萎缩的市场份额也让HP放弃了继续研发PA-RISC和Alpha;IBM则成立Power.org,部分开放IP核,建立多个不同的垂直生态系统(最成功的就是通吃PS3、Wii和XBOX三大游戏平台);Sun则将SPARC架构开放给富士通西门子,与之分摊研发成本;而安腾自进入市场后也鲜有亮眼的表现。
  但这一情况随着处理器业界在单核、高时钟主频的方向上遭遇技术瓶颈而有所转变,漏电效应、制程的限制等麻烦让业界厂商们纷纷转向多核、多线程和异构的研发方向——而多核、多线程必将导致计算和编程环境的并行化,这一情况使得RISC架构处理器显然更有优势。
  为何如此笃定?因为早在2006年12月,从加州伯克利分校所做的一项历时5年,投入超过1000万美元(由微软和Intel赞助)的《并行计算研究前景》报告表明,随着处理器向多核、多线程方向发展,编程人员将在支持多种数据类型的并行模型(如任务级并行、字段级并行和比特级并行)环境下进行开发;传统的操作系统将被解构,函数库和虚拟机将在新型操作系统中更和谐地共存;为了以更低成本,更快速地适应多核并行环境,FPGA(可编程门阵列)、仿真器和各种协处理器将被更多采用。
  不难看出,上面三个论断已经或正在成为现实,而正由于x86架构上的开发者过去只面对单核、单线程编程环境,虚拟机性能和数量上的相对薄弱,以及FPGA(现场可编程门阵列)使用少与异构SoC(片上系统)起步晚的弱点,令RISC和EPIC架构有了复兴的技术优势,而且从IBM、Intel和Sun的报告看,这一优势也许还将继续下去。
  例如在Sun的最新技术报告中,面向重业务负载(高运算量)的Rock和轻业务负载(高吞吐量)的Niagara 3 处理器都将采用65纳米制程,2.3GHz主频和每处理器16核的设计,特别是Rock将采用32线程 32侦测线程(Scout Threads)的新技术,以实现高性能的单线程负载,这与Sun其他的MPU设计大不相同。
  在目前商用处理器普遍采用的Out-of-Order(乱序执行)机制下,每条指令会被追踪和释放。由于内存加载延迟和电路规模的限制(不可能无限制增加电路规模,否则功耗和体积将大幅增加),等待处理的指令队列不可能过于庞大。
  在Rock中,当指令输入到机器的前端后,将被解码并和普通CPU一样进行排序和等待输出。但是,如果指令流为了等待内存加载数据而在队列中停留过久,Rock将会保存该指令的当前状态并记录为一个恢复点(Checkpoint),然后装载侦测线程,并在主线程之前运行。
  这个侦测线程是一个硬件实体,对于操作系统、虚拟机管理软件(如Hypervisor等)和其他能控制处理器资源的软件而言完全透明(不可见),它可以进行指令预测、数据及代码预取,并将该指令推理运行后的状态保存在一个影子注册文件中(Shadow Register File,一种中间寄存器)。最重要的是,当推理运行完该指令后,侦测线程可以完全释放这一指令。
  而当一个侦测线程上的指令由于载入延迟也处于长期停顿状态,主线程实际上可以赶上并超过它时,在这个超越点上,侦测线程和主线程将进行角色互换——即原先的主线程将成为预测线程,而侦测线程则将成为主线程。由于Rock在每个线程上将提供8个恢复点,所以也就是侦测线程和主线程理论上可以分开、汇合或蛙跳式交叉8次。
  除了线程上的优势,非x86架构处理器还在扩大片上缓存和带宽方面的领先。例如Intel在其最新的安腾处理器Tukwila上布置了30MB緩存,处理器间通信带宽达96GB/s,与内存控制器间通信带宽达34GB/s。相较而言,最新四核Xeon 5300系列(开发代号Clovertown)的片上缓存为4MB、6MB、8MB到12MB不等(分别从低功耗版到高性能版),处理器间通信带宽最大值10.66GB/s,内存带宽理论最大值21.3GB/s,其间的性能差异一目了然。
  在虚拟机技术、FPGA、仿真器和各种协处理器的成熟度方面,非x86架构上的操作系统和成熟技术也具有明显优势。
  早在2006年前后,IBM和HP就分别在AIX和HP-UX上实现了精细粒度的虚拟技术,虚拟机管理器均能按照CPU的若干分之一划分处理器资源,并能同时支持数百个虚拟机,这一技术目前在x86平台上还没有实现。
  FPGA和协处理器的应用也是如此。虽然AMD和Intel都拿出了各自基于异构的SoC处理器研发蓝图,但都要等到2009年以后,而在RISC架构上,这一技术早就得到应用——IBM早就推出了支持Java的协处理器,而SGI也推出过加速可视化运算的FPGA。
  
  份额与后继研发:
  繁荣背后的隐忧
  
  在上述形势下,RISC和EPIC架构处理器似乎前景大好,但不可否认的是,其前景虽好,但不可过于乐观,最主要的挑战还是来自研发和制造成本如何摊薄,以及未来研发路线的不明朗。
  根据Gartner 2007年全球服务器市场报告,全球服务器出货量884.1万台,但其中基于x86架构的占据90%以上的份额。而且RISC-EPICUnix服务器的出货量比2006年减少了13.8%。虽然这部分的销售收入比2006年增长了1.7%,但显而易见,如果高昂的研发和制造成本不能通过数量摊薄,其前景仍然堪忧。
  不过IBM和Sun也都在努力地摊薄研发成本。IBM日益壮大且收效明显的Power.org自不必说,Sun也没闲着。Sun目前的组织结构是“4S M”,其中的M即微电子部门。早在1990年代初期,Sun的微电子部门相对独立,可以将生产的处理器销售给Sun以外的公司,但在1990年代末,Sun取消了这一政策,并将微电子部门纳入公司组织内。而在2007年,Sun再度让微电子部门相对独立,允许其可以对第三方客户销售处理器和技术授权,例如对Marvell公司的许可。此外,早年授权富士通进行SPARC64架构的后继开发,以及开放UltraSPARC T1和T2架构处理器的部分知识产权给伙伴等,也都收到积极效果。
  在后继研发方面,相对AMD和Intel在x86架构处理器研发计划和投入上的高调宣传,除了Intel财大气粗,不停宣传着安腾家族的蓝图和投入外,IBM和Sun对于各自的主力处理器产品研发蓝图和投入并没有高调宣传。
  
  01
  
  在IBM英文网站上并不能找到Power7详细信息的页面——除了之前的Power7将用于美国国防部高级研究规划局(DARPA)的千万亿次超级计算机以及它将和Opteron共用相同规格插槽的新闻稿。不过笔者在IBM俄罗斯网站上找到了2007年的Power家族研发蓝图,其上市时间将在2010年前后。在IBM研究中心的Cell工程及Power架构小组的官方博客上可以看到,IBM对Power8何时开始研发并没有明确回答。
  而在Sun的官方网站和相关技术报告中,还没有出现Rock和Niagara3之后的研发计划,而日前Sun宣布Rock将从2008年下半年延期至2009年发布,令一些媒体对Sun的处理器研发前景并不看好。
  不过应该看到的是,由于RISC和EPIC架构处理器长期作为高端产品定位于小众市场,这些客户并不需要如同个人消费者一般随时了解处理器设计的技术细节,他们更关注采用这些处理器的服务器产品对其业务的实际帮助。因而,无论是Intel的高调也好,IBM和Sun的低调也罢,并不能成为非x86架构处理器研发前景美妙或不妙的征兆。
其他文献
企业要想成功,关键是要有创新管理。只有处理好创新战略、创新文化和创新机制三个维度,才能让创新管理行之有效。  —— 周力丹    “这个世界唯一不变的就是变化和创新。当你的公司变化跟不上业界变化的时候,便是公司要考虑退出的时候;当你个人的变化跟不上公司变化的时侯,就是你要被淘汰的时候。” 这句GE的CEO——杰克韦尔奇的著名语录,这些年来,一直影响激励着启明星辰副总裁周力丹不断超越和挑战自我,带领
当多年前,Ian Pratt教授和几个学生在剑桥实验室里埋头编写Xen代码的时候,他没有想到这份从兴趣出发的努力会改变当今的IT平台架构。他更没想到,前不久,当他以Xen.org主席的身份,在Xen开源大会的中国会场发表演讲时,这里来自学术界和工业界的数百名关注Xen的技术人员竟回报给他如此高的热情。    开源生命力    在云计算已成为顺应“IT三国定律”(15~25年分合周期)的大势之时,X
下一代数据中心应用即将到来,美国电信行业协会(TIA)正在核准一项将左右未来全球网络基础设施的光缆标准。最近,TIA的TR-42委员会要求发布适合制造OM4光缆的光纤标准。这项标准通常称之为“OM4光纤”标准,其中详细说明了下一代多模光纤的性能。这些性能说明在TIA-492AAAD新标准接受投票表决时发挥了非常积极的作用。随着新数据中心应用标准即将准备就绪,大多数业界领先企业都想让该标准 ,特别是
QS-330IR是一款基于iSCSI技术的高可用存储系统,它内部集成了台湾领先的iSCSI控制器厂商QSAN公司的最新一代P300H冗余双控制器。控制器采用嵌入式Intel i81342 1.2Ghz双核处理器,8个iSCSI端口支持端口分组聚合功能,支持16颗SAS或SATA硬盘(可扩展至80颗硬盘),为用户提供了一个高效、简单、经济、高性能的存储系统,同时又为用户提供了高性价比的IP SAN解
不管AMD现在是没能力再追求速度还是不想追求速度,很显然,它要把更多精力放在琢磨用户的心思上。  最近,国内外关于AMD的消息着实不少。  先是裁员的传闻。AMD 2007年的业绩不好,业界风传AMD将举起裁员大棒。但是不久AMD就急忙出面予以否认。其实裁员也不是什么丢人的事情,今年已经证实要裁员的已经有IBM、雅虎等巨头在先,AMD即使真的裁员也只是因经济不景气或者面临转型而不得不向自己人开刀的
近日,IBM公司在京发布名为《CIO的时代新声》的2009全球CIO调查结果。今年的IBM全球CIO调查历时4个月,来自全球78个国家、19个行业、各种规模企业的2598位CIO参与此次调查,旨在探究在当前瞬息万变的商业环境下,CIO如何代表整个组织发挥最大的影响力。调查结果显示,成功的CIO实际上需要扮演三对看似相互冲突、实则相辅相成的混合角色,从而实现真正的创新、提高IT投资回报率,以及扩大业
随着ActiveX 控件、Script 脚本和Java 小程序在电子邮件中的广泛使用,所收电子邮件中 HTML 内容在未经许可的情况下访问或修改计算机中文件的可能性也在不断增大。  电子邮件作为当前和未来网络使用者的重要沟通方式,不可避免地涉及到众多的敏感数据,如财务报表、法律文件、电子订单或设计方案等。传统电子邮件的工作方式,由于互联网的开放性、广泛性和匿名性,会存在很多安全隐患。  个人用户如
随着数据存储的飞速发展和信息大膨胀,数据中心重要性大大提高,供电绝对可靠性越来越受到用户的重视,不允许有瞬间的停电。由于单台UPS无此能力,于是出现了冗余供电的概念。早期由单机构成的冗余供电系统,有热备份串联冗余和并联冗余两种。这两种方法多用于中大型机房,但我国70%以上是中型以下的小型机房,用上面的办法受到很多限制,一者投资太大,二者小容量UPS不能并联。于是N X模块化并联冗余的研究被提上议事
近日,河北某县政府采购了一批联想M7250N多功能一体机,凭借高效、稳定的产品性能,保密、安全的功能设置,其专业打印解决方案在政府信息化办公中成为一大亮点!    保密打印功能  保密安全    “我们选择联想M7250N多功能一体机,首先就是它的加密打印和发送锁功能,可以有效地保证打印过程中的信息安全,还可以有效控制打印终端的使用!”县政府的采购干事说道。  联想M7250N特别针对政府、军队、
2008年初,当刘凌进入威胜仪表集团有限公司(以下简称威胜集团)的时候,他的身份是信息总监助理;2008年底,刘凌的助理身份去掉,成为CIO;半年后,威胜集团成立战略发展部,直接对董事会报告,刘凌又成为战略发展部部长。  在威胜集团大事记里,有很醒目的三条是:“2008年11月30日,CMMI启动;2009年1月7日,SAP全新上线;2009年2月12日,威胜集团协同办公平台项目启动。”从这个列表