结构体数据布局优化

被引量 : 0次 | 上传用户:quartz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
处理器和内存之间性能差距的不断增大,使得访存成为制约计算机系统性能提高的重要瓶颈之一。改善程序中数据的局部性,提高缓存利用效率,是缓解处理器和内存性能差距的有效手段。结构体数据布局优化通过对结构体数据进行重新布局,改善结构体数据的局部性,提高程序性能。   结构体数据布局主要包括基于域访问亲和性的、基于域访问频度的和基于最大化划分的结构体数据布局算法。已有的研究工作表明,基于域访问亲和性的结构体数据布局算法能够获得比后两者更好的优化效果。在这种算法中,域访问亲和性信息计算是否精确,直接影响了结构体数据布局变换效果的优劣。因此,本文围绕域访问亲和性信息计算及后续优化开展了一系列研究工作。   本文的三个主要贡献如下:   1、设计了一种精确获取域访问亲和性的方法。   使用插桩的方式,实现和扩展了已有的域访问亲和性的获取。该方法收集的信息能够更加真实地反映运行时的情况,尤其在条件分支、过程间调用和存在大量无关访存的程序中,计算结果更加精确。并扩展了域亲和关系图,使其可以表示实例内和实例间的域访问亲和性。   2、利用相似性模糊聚类分析域访问亲和性信息,指导结构体数据布局变换。   在域访问亲和性信息分析中引入相似性模糊聚类方法,对结构体进行域分组,并根据域分组对结构体数据布局变换进行指导。使其从所有原始数据开始聚类,解决了传统分析方法中需要根据经验选取先验性数值的不足。   3、在龙芯编译器中实现基于域访问亲和性的结构体数据布局变换。   详细介绍了域访问亲和性获取和结构体数据布局变换在龙芯编译器中的实现方法,包括安全性分析和域访问亲和性计算函数的插桩,以及新结构体类型的生成、Very High Whirl中间表示的变换等。并通过实验表明,该方法在结构体数据所占访存时间较长、布局效率不高的CPU2006程序上可以获得性能提升,其中个别程序性能提升可达一倍,提高了龙芯编译器的性能。  
其他文献
本文研究一些最优化约束满足问题的计算复杂性、近似算法以及近似困难性。包括:构造了一个同时优化查询复杂度、随机源以及可靠性三个参数之间权衡的群上同态函数局部检测系统
开放式数控系统是目前数控系统发展的趋势,它具有模块化、标准化、可再次开发、平台无关性以及适应网络操作方式等特点。开放式数控系统为了满足高速的要求可采用多处理器方案
实时性和鲁棒性一直是信息传输过程中最关注的焦点之一。对需求日益增长的流媒体信息来说,实时性和鲁棒性更是迫切需要解决的问题。流媒体信息传输时需要经过压缩编码处理,接
AMR-WB是由3GPP/ETSI于2001年制定,适用于WCDMA和GSM的宽带语音编解码标准,ITU-T于2002年将其选为16KHZ采样率的宽带语音编解码标准G.722.2。从此无线网络与有线网络具有了相同
基于IEEE802.11的WLAN技术的飞速发展和普及,适时满足并引导了移动互联网用户的需求,将用户从固定的办公和生活方式中解放了出来。近年来,不断有支持更高数据传输率的IEEE802.11
统计技术在自然语言处理领域逐渐呈现出健壮和高效的优势,大规模人工标注语料和先进统计学习方法的结合不但催生出更精确的语言处理系统,也将研究工作者从繁重的规则编写中解脱
近年来,随着金融信息化建设的迅速发展以及人们对保管箱业务认识度的逐年提高,银行保管箱业务日益得到普及,对于保管箱业务的需求不断上升。目前银行使用的保管箱信息管理系
IMS是向用户提供多媒体业务的通用网络架构,是下一代网络核心技术。随着IMS网络部署速度加快,多样化的多媒体业务不断涌现。这些纷繁复杂的多媒体业务给通信用户带来方便、快捷
烟草行业中,卷烟包装纸张相关参数的检测是烟草标准化的重要工作内容。其中,卷烟纸直接与消费者接触,其外观参数如罗纹强度、白度、均匀度等是影响卷烟质量和等级的重要指标
随着数字化医学影像的发展,对数字化医学影像的智能化理解已成为必然趋势。计算机辅助检测(Computer-aided Detection,CAD)系统已经成为了医学影像学研究热点之一,并逐步进入了