面向申威GCC编译系统的循环分布技术研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:jiekoala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
编译系统作为高级程序语言到机器码的转换器,它是联系几乎所有软件与硬件的桥梁,编译系统所生成代码的执行效率直接影响硬件体系结构提供的性能。本文面向申威处理器体系结构及指令系统的特点,进一步发挥申威处理器的的硬件性能为目的,以开源GCC编译器的移植和优化为主要研究内容,针对申威GCC性能的不足,开展申威处理器及申威GCC编译系统的研究,深入分析了循环分布技术对编译器的性能影响,据循环分布技术的主要特点,对申威GCC编译性能展开优化,主要工作及创新包含以下内容:(1)提出了一种基于区域间依赖关系图的新的循环分布算法。原有的循环分布算法是基于指令的访存关系进行相应划分与合并,在合并过程中,存在相同访存区域的指令将被合并为同一区域,但这种合并策略有可能造成过度合并从而无法对区域进行分布,本文提出了一种基于区域间依赖关系图的强连通合并算法,从而实现了合并区域的最小化,保证了循环分布的有效性。(2)提出了一种基于向量代价模型指导的循环分布优化方法。构建了面向申威GCC向量化编译及指令特征的代价模型,并将代价模型引入到循环分布过程中,解决了当前编译器因不能评估循环分布的性能而造成的可能的程序性能损失,提升了编译器中实施循环分布变换的程序优化效果。本文工作已在申威GCC编译器中实现,SPEC2006标准测试集测试表明,定点程序平均性能提升3%,浮点程序平均性能提升5%,整体平均性能提升4%,最高加速效果达到了13%,且原有循环分布造成的负加速有效消除,验证了本文工作的正确性和有效性。
其他文献
目的:比较超声引导下经皮射频消融(RFA)治疗第二肝门区肝细胞癌(HCC)与非第二肝门区肝细胞癌(HCC)的疗效和并发症,探索导致经皮RFA治疗第二肝门区HCC技术失败和影响患者肿瘤局部进展和无病生存期的风险因素。材料与方法:收集2010年1月至2018年12月接受超声引导下经皮RFA治疗HCC的患者资料进行回顾性分析,共纳入86例第二肝门区HCC患者,根据肿瘤解剖位置随机选择匹配86例非第二肝门
在本论文中,首先利用零曲率方程,从一个3×3矩阵谱问题出发,推导出了WadatiKonno-Ichikawa方程族的超扩展;然后利用超迹恒等式建立它的超Bi-Hamilton结构;最后利用谱参数展开法得到超Wadati-Konno-Ichikawa方程的无穷守恒律.
背景和目的脑性瘫痪(Cerebral palsy,CP),简称脑瘫,是由于中枢神经病变所引发的运动障碍、姿势发育异常、活动受限的症候群。患儿出生前后1个月内,在各种危险因素的影响下,发生非进行性、永久性的神经发育障碍。目前在我国的脑性瘫痪发病率为2.0‰~3.5‰,相比于全球范围内的1.2‰~5‰略有所低。由于脑部损伤的永久性结果,临床上并没有完全治愈脑瘫的方式。但通过外科手术很大程度上可以矫正脑
目前,我国的高端装备制造技术与国外先进水平相差较大,高端关键零部件约80%依赖进口,严重影响着我国的高端装备行业的发展。要改变这一现象,解决卡脖子问题,就要淘汰现有的“成形”制造,超越表面完整性制造,创新抗疲劳制造理论与技术,并在制造企业中快速实现技术推广与应用。磨削加工是精密加工的最后一道工序,不仅能够保证工件所需的尺寸精度,还能获得较好的表面完整性。工件的表面完整性主要包括表面形貌、表层残余应
河南滑县道口镇,作为历史上的运河古镇,具有“三街六铺七十二胡同”的传统街巷空间结构。受特定的地理、气候环境以及社会文化等方面的共同影响,道口镇的街巷布局方式与空间特征具有很强的地域性,也是居民生活方式与历史文化的物质载体。另外传统街巷空间在古镇既起着交通组织的作用,也是古镇社会组织结构与社会网络的具体体现本文通过对国内外优秀的传统街巷保护与更新案例和相关理论进行研究,从传统街巷空间构成要素分析入手
指令选择将编译器的中间表示转换为针对各种编译目标进行优化的一系列目标平台机器指令,是经典编译器后端有效提升科学计算程序执行性能的重要组成部分,高质量的指令选择对生成代码的大小和质量有很大的影响。2019年,LLVM全球开发者大会将全局指令选择定为大会主题,全局指令选择近两年已成为LLVM后端主流架构的研究热点。在申威平台上进行LLVM全局指令选择技术的实现与优化,对进一步完善申威编译系统具有重要意
银(Ag)纳米材料因为具有广谱抗菌作用,近年来得到了越来越多的关注。研究表明,Ag纳米粒子直径小于10 nm时具有高效的抗菌性,但未加修饰的Ag纳米粒子稳定性差,易团聚、氧化,还会产生细胞毒性,从而限制其作为长期抗菌剂的应用。平衡Ag纳米粒子的高效抗菌性和对生物细胞的低毒性仍然是一项艰巨的工作。由小颗粒组装的晶簇结构具有保持小尺寸效应和大尺寸稳定性的潜力,为解决Ag抗菌纳米材料设计中尺寸大小与稳定
学位
图像处理在遥感技术、医学领域、安全领域、工业生产领域具有广泛的应用,图像边缘检测算法是图像分割、目标识别、形状提取的图像处理分析基础。基于梯度计算的Canny与Sobel算法是当今广泛使用的边缘检测算法。国外主流的Intel处理器、德州仪器TIC66xx信号处理器、NVIDIA的GPU等均适配有成熟的边缘检测算法函数库。飞腾M7002作为一款国产高性能DSP,将边缘检测算法面向该平台适配并生成高效
海洋生物污损是指海洋中的微生物及动植物在船体及水下设施设备表面附着的现象。Ti合金面临的严峻的海洋生物污损问题严重威胁Ti合金装备的服役效能、可靠性及耐久性,极大制约Ti合金在海洋工程的广泛应用。因此,亟待开发能够显著提升Ti合金抗污损性能的绿色、长效、高性能防污方法。基于异质双金属间电偶溶解释放Cu2+防污是潜在有效的Ti合金防污策略,然而,Cu2+的不均匀及快速释放是限制该体系广泛应用的关键问