面向申威平台的LLVM全局指令选择实现与优化

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zcktjbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指令选择将编译器的中间表示转换为针对各种编译目标进行优化的一系列目标平台机器指令,是经典编译器后端有效提升科学计算程序执行性能的重要组成部分,高质量的指令选择对生成代码的大小和质量有很大的影响。2019年,LLVM全球开发者大会将全局指令选择定为大会主题,全局指令选择近两年已成为LLVM后端主流架构的研究热点。在申威平台上进行LLVM全局指令选择技术的实现与优化,对进一步完善申威编译系统具有重要意义。本文的主要工作和创新点如下:(1)实现了面向申威平台的LLVM全局指令选择技术。当前申威LLVM可支持快速指令选择和基于DAG的指令选择两种指令选择技术,但面临着指令选择编译效率低、优化粒度小和模块可重用性差等问题。全局指令选择兼具上述两种指令选择的优点,以SSA图覆盖的形式对整个函数进行降级,结合申威处理器结构特点,设计并实现了面向申威平台的LLVM-IR降级、合法化、寄存器组选择和指令选择的LLVM全局指令选择技术,有效地解决了当前申威LLVM在指令选择过程中存在的问题。(2)实现了面向申威平台的LLVM全局指令选择的优化。首先,提出一种基于代价模型的指令合并优化方法,通过扩展的精确指令代价收益分析模型指导全局指令合并,实现对激进指令合并的有效收益分析;其次,实现一种基于全局寄存器组选择的优化方法,通过对函数中机器指令分配寄存器组的代价分析,最小化机器指令跨寄存器组传送数据的开销;最后,实现一种基于全局的指令局部性优化方法,通过指令局部性优化算法缩小常量或某些变量的活跃区间,预先处理寄存器分配阶段存在的寄存器溢出问题。通过对SPEC CPU2006的测试,实验结果表明,面向申威平台的LLVM全局指令选择实现工作相比当前的两种指令选择技术,LLC编译效率平均提升20%,整个编译周期平均提升6%-8%。基于LLVM全局指令选择的优化工作相比优化前,平均加速比为1.08,最大加速比为1.36。
其他文献
随着通信技术的迅速发展和电子设备的广泛应用,电磁污染已经成为工业、商业以及军事等领域不容忽视的问题,这些电磁辐射干扰不仅会影响精密电子仪器及系统的正常使用,还会污染环境及影响人类健康。因此,需要有效的举措来控制或减轻电磁污染。电磁屏蔽材料是实现高效电磁屏蔽的关键因素。传统的电磁屏蔽材料以金属材料及聚合物复合材料为主,但已难满足快速发展的可穿戴电子设备的要求。与此同时,日益复杂和多元化的电子器件使用
背景食管癌是全球范围内常见的消化道恶性肿瘤,恶性程度高预后差,死亡率在全部癌种中排第6位,在我国位于第4位。由于食管癌病情隐匿,绝大多数患者确诊时已于中晚期,经单独手术的总体5年生存率较低。经过近几十年来的探索,新辅助化疗被证实可以对肿瘤进行降期、消除微转移并延长患者远期生存,新辅助化疗已经逐步成为食管癌尤其是局部晚期食管癌的主要治疗方式之一。根据多项临床研究的结果表明,新辅助化疗有效的患者其5年
学位
背景和目的肾细胞癌(Renal cell carcinoma,RCC)是泌尿生殖系统常见的恶性肿瘤。经循环转移是肾细胞癌转移灶形成的重要途径。循环肿瘤细胞(Circulating tumor cells,CTCs)是指肿瘤细胞从原发部位脱落或转移到外周血中的肿瘤细胞。它们可能附着并生长在远处器官,长期以来被认为是肿瘤侵袭性的标志。循环肿瘤细胞的检测为评价肿瘤负荷和侵袭性提供了一个新的有力工具。在本
知识库问答融合了自然语言处理的核心技术,旨在利用知识库中的三元组回答用户的自然语言问句,现已逐渐成为人机交互的新趋势。面对大规模知识库,自动问答技术提供了一种高效、准确的信息获取方式与途径。近年来,国内外开始涌现一些大规模的知识库,如国外的Freebase、DBpedia,以及国内由NLPCC在2016年在KBQA评测任务下提供的开放域中文知识库等等,它们都提供了大量数据基础,使得基于大规模的知识
目的:比较超声引导下经皮射频消融(RFA)治疗第二肝门区肝细胞癌(HCC)与非第二肝门区肝细胞癌(HCC)的疗效和并发症,探索导致经皮RFA治疗第二肝门区HCC技术失败和影响患者肿瘤局部进展和无病生存期的风险因素。材料与方法:收集2010年1月至2018年12月接受超声引导下经皮RFA治疗HCC的患者资料进行回顾性分析,共纳入86例第二肝门区HCC患者,根据肿瘤解剖位置随机选择匹配86例非第二肝门
在本论文中,首先利用零曲率方程,从一个3×3矩阵谱问题出发,推导出了WadatiKonno-Ichikawa方程族的超扩展;然后利用超迹恒等式建立它的超Bi-Hamilton结构;最后利用谱参数展开法得到超Wadati-Konno-Ichikawa方程的无穷守恒律.
背景和目的脑性瘫痪(Cerebral palsy,CP),简称脑瘫,是由于中枢神经病变所引发的运动障碍、姿势发育异常、活动受限的症候群。患儿出生前后1个月内,在各种危险因素的影响下,发生非进行性、永久性的神经发育障碍。目前在我国的脑性瘫痪发病率为2.0‰~3.5‰,相比于全球范围内的1.2‰~5‰略有所低。由于脑部损伤的永久性结果,临床上并没有完全治愈脑瘫的方式。但通过外科手术很大程度上可以矫正脑
目前,我国的高端装备制造技术与国外先进水平相差较大,高端关键零部件约80%依赖进口,严重影响着我国的高端装备行业的发展。要改变这一现象,解决卡脖子问题,就要淘汰现有的“成形”制造,超越表面完整性制造,创新抗疲劳制造理论与技术,并在制造企业中快速实现技术推广与应用。磨削加工是精密加工的最后一道工序,不仅能够保证工件所需的尺寸精度,还能获得较好的表面完整性。工件的表面完整性主要包括表面形貌、表层残余应
河南滑县道口镇,作为历史上的运河古镇,具有“三街六铺七十二胡同”的传统街巷空间结构。受特定的地理、气候环境以及社会文化等方面的共同影响,道口镇的街巷布局方式与空间特征具有很强的地域性,也是居民生活方式与历史文化的物质载体。另外传统街巷空间在古镇既起着交通组织的作用,也是古镇社会组织结构与社会网络的具体体现本文通过对国内外优秀的传统街巷保护与更新案例和相关理论进行研究,从传统街巷空间构成要素分析入手