编译指导的自动向量化关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:weijiang321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主流通用微处理器都已支持SIMD体系结构,面向SIMD的自动向量化是提高程序性能的重要手段。而在程序中手工加入指导命令,辅助编译器提升自动向量化能力的编译优化技术也已成为一个重要的发展趋势。本文研究编译指导的自动向量化技术。最新的OpenMP 4.0规范加入了面向SIMD体系结构的编译指导,目的在于直接指导循环的自动向量化。GCC作为广泛使用的开源编译器,适合研究各类编译优化技术的具体实现,2014年4月发布的GCC 4.9.0正式版已能识别OpenMP 4.0规范中定义的SIMD编译指导。本文首先研究OpenMP的SIMD编译指导。OpenMP应用编程接口是面向共享主存多处理机系统进行并行程序设计的事实标准,用户通过在程序中手工加入OpenMP编译指导,能实现程序的多线程并行。本文分析了SIMD编译指导的设计和使用方法,以及它在GCC 4.9.0中的实现情况,并分别测试了SIMD编译指导在ICC编译器和GCC编译器下对循环性能的影响。然后,本文研究紧嵌套循环与OpenMP规范中的collapse从句结合后的自动向量化效果。主要剖析了collapse从句如何影响紧嵌套循环在中间表示层的变化,之后对OpenMP三种结构下的collapse从句对紧嵌套循环自动向量化效果的影响做实验测试,分析了其在GCC现有实现中的不足。最后,基于GCC编译器,重新设计了loop结构下collapse从句在OpenMP扩展遍中的实现。实验结果表明对GCC编译器的改进能使collapse从句下的循环成功向量化,并有性能提高。
其他文献
目前,许多企业已建成多个信息管理系统,这些系统各自独立,用户与系统、企业内各部门之间均是点对点的信息结构,这种信息结构使得用户需要在不同的系统之间进行切换和登录认证,数据
计算机产业在近几十年来迅速地发展,随着性能与功耗的提升,二者之间开始相互制约,如何提高系统的能效变得亟不可待。精确的功耗估算能够为操作系统调度、软硬件能效优化提供
通信系统中的安全问题是依靠密码体制来解决的。现代密码体制总是假定算法是公开的,因此密码系统的安全就完全取决于密钥的安全,密钥是密码系统的核心。由于对称加密在效率上的
网络的介入使教育的面貌焕然一新,而网络的开放性、媒体形式的多样性、虚拟、跨地域、资源丰富的特点,使之成为协作学习的天然载体。本文立足于对协作学习发展现状理性思考和深
数据挖掘经过十几年的研究,特别是最近几年,一些基本概念和方法趋于清晰,它的研究也向更深入的方向发展。随着信息技术的发展和互联网的兴起,数据量急剧膨胀,而且数据的形式也多种
在计算机飞速发展的今天,既存计算机系统的比例越来越大,由于需求改变、平台升级以及新技术出现使得我们不得不对这些既存系统进行相应的升级改造以满足新形势要求。随着这种既
文字有其特定的形状并被赋予特定的含义,这种特定的形状称为字形,它是一种可以辨认的抽象图形符号。在计算机出现之后,首要问题是如何把字形转换成计算机能够识别和处理的信息,也
软件工程的出现是为了通过借鉴传统工业的工程化思想和方法,以期提高软件质量和控制软件的成本,解决软件危机。软件工程历经了近四十年的历史,尽管硕果累累,但仍没有从根本上解决
央行会计核算系统(Central Bank Account Booking System以下简写为ABS)是人民银行中心支行及其以上辖区内会计核算集中处理,并通过中国现代化支付系统连接,实现中央银行资金清
设计模式是目前在系统开发方法研究中的一个比较热门的话题,企业网络化制造也是现在制造企业的主要技术发展方向。本文以应用网络化制造技术的中小型企业为研究对象,通过对广西