【摘 要】
:
内存访问延迟是现代大多数应用程序的性能瓶颈之一。数据排布优化通过改善程序访问缓存的局部性行为来提升程序的访存性能,是提升缓存利用率的有效方法之一。现代大多数访存密集型应用程序中存在较多的结构体数据,结构体的访存性能已成为该类程序性能提升的关键因素。设计有效的结构体排布优化方案,能够提升缓存的局部性性能,对程序的性能优化十分有意义。本文基于结构体的数据排布优化对缓存性能提升进行研究,主要工作内容如下
论文部分内容阅读
内存访问延迟是现代大多数应用程序的性能瓶颈之一。数据排布优化通过改善程序访问缓存的局部性行为来提升程序的访存性能,是提升缓存利用率的有效方法之一。现代大多数访存密集型应用程序中存在较多的结构体数据,结构体的访存性能已成为该类程序性能提升的关键因素。设计有效的结构体排布优化方案,能够提升缓存的局部性性能,对程序的性能优化十分有意义。本文基于结构体的数据排布优化对缓存性能提升进行研究,主要工作内容如下:(1)针对结构体字段访存行为分析的问题,建立一个结构体字段访存的时空模型。首先根据字段访存的统计信息,将结构体的字段进行冷热分离。然后通过结合热字段访存的时间戳信息和其在缓存中的空间信息来统计热字段之间的相关访存次数。最后基于Apriori算法和周期校正的动态时间规整方法计算热字段之间的访存行为相似度。(2)针对结构体排布优化方案的选取问题,设计及实现基于访存轨迹的缓存性能建模工具。基于动态检测生成的程序访存轨迹信息,对程序的缓存行为进行建模,以比较不同参数下的优化方案的缓存性能,进而根据优化目标选择最合适的结构体排布优化方案。(3)针对结构体的字段重排优化问题,提出一种基于Louvain聚类的结构体字段重排算法。首先根据结构体热字段之间的相关访存计数以及访存行为相似度构建Louvain社区。然后通过对热字段的多次社区检测,形成最终的重排分类方案。最后考虑到结构体字段对齐对缓存性能的影响,对重排方案的每个分类进行对齐优化。(4)针对结构体的拆分优化问题,提出一种基于字段访存时空模型的结构体拆分优化算法。依据字段的访存时空模型,结合近似最优分割的思想,实现一种启发式的结构体拆分优化算法,以生成结构体的拆分优化方案。针对不同的拆分场景,分别实现指针索引优化和内存池化优化。与前沿的结构体拆分优化方法对比,进一步提升优化性能,基准程序的平均运行时间加速比达到1.37x。综上所述,本文提出新的结构体排布优化模型和算法,并在公开的基准程序上取得显著的优化效果。
其他文献
南海作为特提斯与西太平洋两大全球构造域系统的共同作用区域,构造背景复杂,岩浆活动强烈,其成因及演化历史一直是地学研究的前沿热点。现有的研究表明,南海的形成不是单一动力学机制可以解释的。现有的成因机制,例如碰撞挤出模型,弧后扩张模型,古南海俯冲模型以及地幔柱模型等都存在着一定的局限性。除此之外,对于印度-欧亚碰撞缝合线,海南地幔柱初始活动时间和空间位置分布以及青藏高原东南缘地壳弱化物质如何向东南延伸
魏晋时期的历史,是基本上处于分裂状态的历史。历史学家普遍认为魏晋时期(220--317年)是一个分裂、混乱的历史时期。可事实上,魏晋时期虽然经历了分裂、动荡和破坏,但也是中国社会经历深刻变化的时期,中华文化由此焕发出新的生机。这显示出魏晋时期所独具的时代特点和历史特征。当时中央集权相对衰弱,地方势力(包括地方政权、军阀和强宗大族的势力)膨胀,出现了地方割据的局面。尽管曹魏是在公元220年建立的,但
氢原子转移(HAT)是指在一个动力学过程中,将一个电子和一个质子从氢供体协同转移到氢受体的过程,提供了直接生成自由基的方法。近年来,光促进氢原子转移催化已经发展成为有机合成化学中热门的研究领域之一,利用清洁易得的光能活化脂肪族碳氢键并产生高活性的自由基中间体,实现廉价易得原料到复杂分子的高效转化。本论文研究了多种官能化试剂参与的基于光促进氢原子转移脂肪族碳氢键官能化反应,主要包括以下三部分内容:我
基于电化学发光的生物标记物检测已得到了飞速的发展,然而绝大多数的检测需固定识别基团,这依赖于电极表面的层层化学修饰,不但难以重现电极的表面状态,而且在电极的制备阶段需要消耗大量时间,难以实现批量化生产和自动化检测。此外,目前大多应用集中在以两抗夹心式的标记法检测,这种方式常需要引入发光体标记的第二抗体进行孵育,这延长了检测的准备时间。因此开发一种能够快速构建的传感器势在必行。热电子诱导的阴极电化学
以往的研究关注了疏浚泥堆场扩容,但利用秸秆绳对围堰进行加固则少有论及。为了解决疏浚泥堆场长期占地问题,并合理地利用秸秆资源,本文提出将秸秆绳编织成秸秆格栅,放入围堰内用于加固围堰。为了研究秸秆绳对围堰的加筋效应,本文进行了拉伸试验和拉拔试验,分析了秸秆绳在土体中不同降解程度下的拉伸特性和界面摩擦特性;使用有限元软件ABAQUS进行模拟运算,并用Design Expert进行响应面分析,进一步研究了
荧光生物传感器因其具有灵敏度高、选择性好和操作简单便捷等优点,已在生物小分子、金属离子、生物酶活性以及癌症标记物的分析检测等领域得到广泛应用。随着纳米技术的飞速发展以及纳米模拟酶概念的提出,纳米酶因其可模仿天然酶的催化功能且具有良好的稳定性,在生物传感及纳米诊疗体系发挥着重要作用。截至目前的文献报道,基于纳米酶构筑的传感器主要集中在利用其催化底物(如:OPD、TMB、ABTS)显色,实现待测物定量
量子密码学是一门具有革命性的综合性新兴前沿交叉学科。量子密码学是在“一次一密”通信系统中融合量子密钥分发(Quantum Key Distribution,QKD)技术,利用不确定性原理和不可复制定理,融合现代密码学信息加密和传输方式,突破传统加密依赖于假设窃听者的有限运算能力的相对安全,实现信息传输网络空间的信息论安全,开辟网络空间量子信息安全科学的理论和实验研究领域。连续变量量子密钥分发(Co
视网膜是中枢神经系统的一部分,由多种类型的神经元(感光细胞、水平细胞、双极细胞、无长突细胞和视网膜神经节细胞)和胶质细胞组成,负责处理视觉信息。解析人类胚胎视网膜发育过程的分子机制对于视网膜疾病的预防和治疗是极其重要的。目前视网膜发育的研究大部分是基于模式动物,而有关人类胚胎视网膜发生的分子机制研究仍很少。近年来,高通量测序技术的发展为研究者们全面揭示器官的发育过程提供了可能。现有的组学研究已经描
县政是县域政治的简称,是围绕县域公共事务所形成的一系列制度安排、组织结构、权力关系和治理政策、治理活动的总称。县政是国家政治的重要组成部分。本文以元和县令李超琼任内的政务处理为例,探讨晚清苏州府附郭县的县政运作。苏州府一城三首县的情况在清代乃至整个中国县制历史上是少有的,同时,苏州府为江苏省会之一,巡抚、布政使、按察使、苏州知府等众多大小衙门驻扎该地。处理与众多上级衙署的关系以及与其他同城同级衙署