龙芯编译器中多面体优化技术的研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:axjlzpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
内存访问瓶颈一直是影响程序性能的关键因素。由于循环嵌套在程序执行中所占的时间比重非常大,通过对程序中的循环进行优化以提高程序的局部性,一直是编译优化的热点。传统的循环优化由于严格的模式匹配规则的限制和不灵活的变换次序,往往会丧失许多优化的机会。多面体优化技术是一种针对循环嵌套进行优化的编译技术,它使用多面体表示形式来表示程序及其依赖关系,基于线性代数和整数规划对程序进行变换。它能有效地克服传统的循环优化的限制,更为灵活有效地优化程序。本文旨在研究和实现龙芯编译器中的多面体优化模型。本文的主要工作和贡献如下:   1.设计并实现了龙芯编译器中的多面体优化模型。该模型基于已有的开源工具:静态控制结构识别工具WRaP-IT、多面体变换工具PLuTo和多面体代码生成工具CLooG,我们实现了另外的静态控制结构转换模块和中间表示生成模块,并解决了一些该模型在编译器内部的交互问题,使得龙芯编译器能有效地利用多面体技术对程序进行优化。   2.扩展了龙芯编译器中多面体模型能优化的程序的范围。我们在支持动态数组和形参数组、更精确地识别结构体数组等复杂的访存形式以及消去语句迭代域的Union of domains这三个方面对多面体模型进行了扩展,有效地提高了多面体模型的实用性。   3.利用多面体模型优化程序。实验数据表明多面体优化相比原有的循环优化具有更完备的分析和优化能力。在龙芯2F实验平台上,相比龙芯编译器中原有的循环优化,多面体优化模型可以在Polybench-2.0和Polybench-3.1测试集上分别达到2.3倍和3.6倍的加速比,在SPECCPU2000中的172.mgrid上可以获得7.2%的加速。
其他文献
传感器节点在监测区域内监测信息,比如温度、湿度、光照、压强等,并将监测到的消息发送给汇聚节点,汇聚节点通过互联网将信息传给观察者。  与传统无线网络相比无线传感器网络
移动对象的轨迹预测是一种积极的管理策略,也是一种智能的管理策略。各种便携式移动通信设备被逐步安装到车辆等移动对象上,交通管理系统从而积累了各种移动对象的大量轨迹。在
物流链中企业之间存在着大量的电子表单交换需求,如订货单、发货单、入库确认单等。由于交互的企业之间使用的操作系统不一致、应用系统不一致、数据格式不一致,这些异构表单的
网络集中存储系统是数据处理集群存储和共享数据的一种重要方式,它有着高密度,易共享,高可靠,易管理等优点。随着数据存储和处理需求的爆炸性增长,以及计算能力的快速发展,传
无线多跳网络已经逐步成为向无线终端提供接入服务的主要网络形式,是移动互联网接入网的重要组成部分。无线多跳网络的开放、自组织和多跳特性使得保障接入安全面临很大挑战,
近年来,数码相机和拍照手机产品的广泛应用催生了海量照片,个人电子照片库越来越庞大。与此同时,社交网络的流行带动着个人照片的大量分享,例如Facebook、Fliekr、人人网、微
随着GNSS(Global Navigation Satellite System)技术的不断发展,具有高灵活性以及强适应性的软件接收机系统已经成为导航接收机研究的热点,本课题在调研分析软件GNSS接收机应
WiMAX全称是Worldwide Interoperability for Microwave Access,即微波接入全球互操作,它是基于IEEE802.16标准的一项新兴无线城域网技术,能够提供面向互联网的高速连接。它具有
随着SOA(Service-Oriented Architecture)这一面向服务的软件体系架构在企业中的广泛应用,Web服务己成为在网络环境下对资源进行封装、抽象和虚拟化的主要手段之一。服务组合
图像分割问题是医学图像处理领域的一个重要问题,它是医学图像三维重建、仿真和理解的前提。变分水平集方法相对经典分割算法有更严密的数学基础,它成为医学图像分割新兴手段,已