低开销的迭代编译优化关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迭代编译是近年来针对高性能体系结构程序性能优化领域的一个新的研究热点。它挖掘各种变换的参数序列,生成程序的很多版本,并通过在目标平台上执行程序来选择具有最大性能加速比的程序版本,性能优化效果显著优于静态编译方法。但迭代编译优化过程中变换参数及变换集的选取、变换的实施顺序和实施次数等,均导致一个巨大的优化空间,而且由于依赖多次编译执行候选代码选择最优的程序版本,迭代编译通常非常耗时,优化开销巨大,对通用程序的优化面临很大困难。针对此,本文从优化空间修剪、搜索算法、优化空间划分、程序变换表示、优化框架等多方面出发,降低迭代编译的优化开销。持续的程序优化实验验证了新技术的有效性。论文主要研究成果如下:1.探讨了迭代编译的技术内涵与特征,对其研究现状进行综述,并指出当前迭代编译技术中存在的问题。2.提出基于机器体系结构参数和程序经验知识的优化空间修剪技术,实验结果表明该方法显著降低迭代编译优化开销。3.提出基于Nelder-Mead单纯形算法的优化参数搜索方法,实验结果表明对优化参数搜索问题,该算法可以找到比遗传算法和随机算法更优的变换参数,并且大多数情况下其搜索开销低于遗传算法。4.提出结合单变量边缘分布算法和单纯形方法的参数搜索算法—UMDA/S,利用优化空间结构和参数间依赖关系有效求解参数搜索问题。并提出精英保留、加权估计、实值变异等改进策略提高搜索算法的性能。与三种搜索算法的实验比较说明UMDA/S可以找到更加优秀的参数值,有效提高程序性能。5.提出基于硬件性能计数器的优化变换决策模型POTraM,决定何时以何种顺序对程序实施何种程序变换,划分优化空间。实验结果表明该模型可有效提高程序的浮点性能,降低程序运行时间,缩小程序持续性能与机器峰值性能的差距。6.为有效挖掘最优的循环变换序列和最优的变换参数,提出一个综合性的迭代编译优化框架PIT,集成多面体模型和模型指导的迭代编译技术,自动进行非参数化的代码变换、模型指导的参数化代码变换以及自动参数搜索。对三个典型计算内核程序的测试结果表明PIT可以对复杂的循环嵌套生成高效的代码,产生的性能收益远远超过本地编译器最高级别的优化,而且性能优化效果明显优于当前基于多面体模型的循环变换系统和迭代编译技术。
其他文献
以氮气作载气,采用冷喷涂技术成功地制备了NiCoCrAlY涂层及NiCoCrAlY/ZrO2复合涂层,并研究了涂层表面和横截面的微观结构、粒子之间的结合变形情况以及涂层的显微硬度。结果表明
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
2015年11月30日.四川省哲学社会科学重点研究基地——四川医事卫生法治研究中心(以下简称“医法研究中心”)——正式对外发布2016年度课题公告、指南。截至2016年3月31日,共收到
分布式虚拟环境系统由于其低成本,可重复,以及安全性等特点,已在军事仿真、网络娱乐、远程教育、工程设计以及电子商务等方面得到了广泛的应用。时序一致性问题是分布式虚拟
证券价格分析主要分为基本面和技术面分析两种方法,而本文则从供求理论的角度去观察研究证券价格,从价格形成的根源和本质上去描述价格趋势以及其表现形式,并简介在实践中的
基于技术采纳与利用整合理论探讨影响企业内部网用户接受的因素,通过文献分析和调研提出了研究模型,该模型是对技术采纳与利用整合理论的扩展,新增了趣味性影响因素,用象征接受因
计算机支持协同工作(CSCW)目标是在计算机支持的环境中,一个群体协同工作完成一项共同的任务。现有的网络基础设施为大多数的CSCW用户提供通信保障。自组网(Ad Hoc Networks)是一
针对冲击片雷管高压放电试验存在偶发高压放电不完全、有触电安全隐患的现象,采用了高压门控联锁报警的设计方法来有效解决这一问题;并在此报警系统中引入了红外探测和语音提
职业倦怠现象会严重危害教师的身心健康,影响教学效果,而且对学生的健康成长以及学校的发展产生较大的负面影响。本文对高等职业院校青年英语教师职业倦怠的成因以及对策进行
语言的性别差异自上世纪七十年代以来,一直是社会语言学家们关注的焦点和研究的课题,从最初的描述性记录,到后来的根源性研究,无一不渗透着语言学家们对这一语言社会问题的学