AVX高级矢量扩展指令集

来源 :计算机世界 | 被引量 : 0次 | 上传用户:lixjiea875623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在上一篇连载中,笔者介绍了Sandy Bridge微架构中对性能有很大影响的几处改进,然而最重要的执行单元的变化没有涉及到,这部分的变化还跟Sandy Bridge新加入的AVX指令集相关。AVX(Advanced Vector Extensions,高级矢量扩展)是X86上重要的指令集改进,不仅仅在于其对性能的明显提升,还在于其对现有X86指令集的多种革新。
  
  强大的性能:256位向量计算
  
  向量就是多个标量的组合,通常意味着SIMD(单指令多数据),就是一个指令同时对多个数据进行处理,达到很大的吞吐量。
  Sandy Bridge的AVX将X86向量化宽度扩展到了256位,原有的16个128位XMM寄存器扩充为256位的YMM寄存器,可以同时处理8个单精度浮点数和4个双精度浮点数,在理想情况下,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。
  从Nehalem开始的微架构包含了3个运算端口:0、1和5,每个运算端口分为三个区域:ALU、SIMD INT、SIMD FP,分别执行整数和逻辑运算、SIMD整数和SIMD浮点运算。在每一个时钟周期,每个运算端口可以分发一个uop,这个uop可以是三种运算中任意的一种。不同的运算区域可以同时运作。
  Sandy Bridge微架构的所有执行单元都经过了修改以执行256位AVX指令,它并没有直接将所有浮点执行单元扩充到256位宽度,而是采用了一种较为节约晶体管乃至能耗的方法:重用128位的SIMD整数和SIMD浮点路径。
  除了AVX带来的性能增强之外,Sandy Bridge还继续增强了AES指令集的性能,提升其吞吐量,此外,SHLD(移位)指令、ADC(进位加)指令和Multiply(64位乘数128位积)运算的性能也都得到了提升,SHLD指令性能提升增强了SHA-1计算能力,ADC吞吐量翻倍提升了大数值运算能力,而最后者提升了现有RSA程序25%的性能。
  精简X86指令集
  除了明显提升浮点运算性能之外,AVX指令集还是对X86指令集的一个精简。我们知道由于是不定长的CISC指令集,X86指令集可以很容易地进行扩展,每一代处理器都像不要钱似的增加扩展指令集。然而目前的这种通过增加各种Prefix前缀来扩展指令集的方式已经达到了其极限,并且这种方式导致的指令集复杂化和长度增加,导致了执行文件的臃肿和解码器单元的复杂化和低效化。
  AVX指令集带来了新的操作码编码方式,这种编码方式叫做VEX(Vector Extension),其动机就是压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力。
  VEX编码方式使用了两种VEX Prefix,除了一个字节的字头之外,分别具有1到2个字节的Payload(负载),在这个Payload里面就包括了所有的Prefix的内容,达到了精简指令集的目的。
  VEX前缀包含了X86-64指令使用的REX前缀以及原SSE指令使用的前缀,还融合了普通操作码带有的Escape字段,从某种意义上来说,VEX让CISC的X86指令集往RISC精简指令集靠近了一点,当然,CISC易于扩充、支持复杂灵活的寻址方式的特性依然无损。
  
  强化X86指令集
  
  基于历史上X86处理器缺乏存储单元的原因,X86指令集属于双操作数的破坏性指令集,例如,指令add ax, bx包含了ax和bx两个操作数,作用是将寄存器ax和bx的数值相加,并保存到寄存器ax当中去,计算结束后,源操作数ax的内容就被计算结果“摧毁”了。
  在传统的仅具有8个通用寄存器的X86处理器上,这种编码方式的使用实属没有办法,同时期具有更多通用寄存器的RISC处理器都采用的是多操作数的非破坏性句法。在应用了Register Renaming寄存器重命名技术之后,X86处理器事实上也具有了很多的寄存器可供使用,因此Intel就动起了新的念头。Sandy Bridge带来的AVX指令集提供了新的3
其他文献
在本届柏林消费电子展(IFA)上,各个知名厂商都推出了互联网电视产品,在国内的电器卖场里互联网电视也成为销售热点。但是对于希望让普通电视播放互联网视频的用户以及希望在旅行中能够随时播放互联网音频、视频的用户,他们的愿望能否满足?爱国者MP6智能网络播放器就实现了这个梦想。  从MP6这个名字上就可以看出这应该是一台具有全新概念的产品,的确如此,这台MP6智能网络播放器的外形就像一个袖珍电视机,它具
自从2009年6月发布世界上首款微型单电相机PEN E-P1后(又称为电子取景可更换镜头相机,EVIL),奥林巴斯不仅复原了PEN系列相机50年的经典血统,还将PEN“以镜代笔”的影像理念继续发扬光大。2011年年初,奥林巴斯又带来了这样一款新品:E-PL2,在保持轻巧机身纪录的同时,在拍摄功能、成像品质方面又有了进一步的提升。    机身镜头同进化    2011年年初发布的E-PL2,根据奥林
在苹果iPhone4手机已经逐渐成为“街机”的今天,Hillstone新技术副总裁王钟还在使用iPhone4的上一代产品,“对于我来说,这个手机已经满足我的需求了。不是有传言说苹果马上要推出iPhone4的下一代产品了吗?即使出了我也不一定会买。”王钟在日前举行的中国RSA信息安全大会2012上接受采访时表示。他认为,以需求为前提的消费观不仅仅适用于手机,也同样适用于信息安全产品。  近年来,IT
TFT-LCD液晶显示面板已经发展到第八代。第八代形成了具有良好经济性的55英寸屏的产能,迅速占领原先为等离子屏主导的大屏市场。那么,第八代以后是什么?    首先,55英寸以上并非主流市场,其市场容量远低于55英寸以下市场。其次,TFT-LCD在技术上已相当成熟,功能性能上难有突破。所以有“面板产业将在第八代制造工艺以后迷失方向”的说法。  最近有媒体报道,韩国面板业普遍认为,液晶面板很快就要像
本报综合报道 10月25日,Facebook股价周三收盘大幅上涨19%,主要由于据该公司上周二发布的财报显示,第三季度Facebook来自于移动广告业务的营收意外增长,从而缓和了市场有关这家公司无法利用智能手机和平板电脑用户大幅增加来实现盈利的担忧情绪。  财报显示,Facebook第三季度营收12.6亿美元,同比增长32%。这家创建8年的社交网站,月活跃用户已达10.1亿。同期移动业务月活跃用户
在安全领域,僵尸网络并不新鲜。它是指采用一种或多种传播手段将大量电脑感染僵尸程序病毒,从而在控制者和被感染电脑之间所形成的一个可一对多控制的网络。传统的僵尸病毒只会感染电脑,而不会感染手机。而今,随着智能手机的普及,僵尸网络盯上了智能手机,尤其是安卓(Android)手机。安全业界近期发现,垃圾邮件发送者创建了一个由安卓手机组成的僵尸网络来发送垃圾短信。  “我认为,运营商目前还在研究该如何处理这
近日,信息技术服务标准(ITSS)北京市验证与应用试点启动会在京举行,工业和信息化部软件司、电子四所、北京市经济和信息化委员会、神州数码等成员单位出席。本次大会的召开标志着ITSS在北京地区验证与应用试点的正式启动。  据工信部软件司信息服务业处副处长任利华介绍,此次推行8 1试点城市工作是为验证并推广信息技术服务5项标准的应用,并在实践中验证标准的技术条款,提高标准研制水平,以规范和促进信息技术
城市的出现是人类文明发展的重要标志。《吴越春秋》一书有这样的记载:“筑城以卫君,造郭以卫民。”在这个高度聚集的地方,城市需要本着以人为本的理念,在注重改善市民生活环境,不断提高人们物质生活、政治生活和精神文化生活的质量的同时,保障市民生活环境的和谐安康。  何为和谐城市?《上海宣言》中有这样的描述:“和谐城市,应该是建立在可持续发展基础之上的合理有序、自我更新、充满活力的城市生命体,是生态环境友好
尽管有69%的企业都会允许员工的个人设备连接到办公网络,但是,仍然有21%的企业并没有在企业网络上管理员工使用个人移动设备的策略,这一数字超过了所有接受调查样本的1/5。  安全产品公司Courion最近所公布的这一调查数据清晰地表明,许多安全主管仍然无视员工移动设备所带来的安全问题。  安全研究公司IANS研究和服务交付部门高级副总裁Chris Silva认为,要想避免个人移动设备所带来的固有风
“云计算将为系统集成商带来新的机会。”自动系统集团有限公司(Automated Systems Holdings Limited,ASL)执行董事兼行政总裁许永财日前在接受采访时表示,“我们的业务以IT服务为主,而云计算将成为IT服务的重要组成部分。”  作为一家成立于1973年的公司,ASL经历了多次转型,业务也从曾经的售卖数码、UNIX产品到如今的数据中心服务、安全服务以及软件开发。2009年