基于使用行为的Cache设计和运行时Cache性能优化

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
内存已成为当前计算机系统性能的主要瓶颈之一,它的访问速度通常比处理器慢上数百倍。为缩小内存和处理器间的速度差异,cache得到了普遍应用。它对计算机性能的影响也随内存延时和程序内存需求的持续增加而日益增大。Cache工作的基础是程序对数据访问的局部性。现有的设计较少关注各级cache数据访问的本地局部性特征以及不同程序或者程序的不同阶段对数据的不同访问行为,因此,难以使cache充分适应多样化的局部性,限制了cache的性能。本文从新的角度分析了程序对各级cache的不同使用行为特征,提出了基于使用行为的cache设计和运行时cache性能优化。针对L1 cache,本文研究了它的缺失局部性。采用本文提出的短缺失周期作为程序阶段的标尺,本文观察到L1 cache的缺失主要来自少数几个泄漏组,并且,这些泄漏组具有良好的连续性和可预测性。基于上述现象,本文提出了使用泄漏组缓存结构来减少低关联度cache的缺失局部性。通过预测泄漏组的出现位置,泄漏组缓存于运行时动态地缓存这些泄漏组,在不影响访问延时的前提下减少冲突缺失。在L2 cache中,传统的LRU替换策略对大于cache容量的工作集表现极差,导致了大量较少重用块的出现,此时,可通过只在cache中保留一部分工作集来提高性能。现有解决方案通过过滤未重用块来实现这一目标,但是受到未重用块数量的严格限制,它们可能由于未重用块的缺乏而失效。本文提出了一种新的基于重用频率的过滤机制。该过滤机制通过预测和过滤掉较少重用块而不单单是未重用块,可以增加将程序工作集最频繁访问的部分容纳入cache的可能性,克服了现有的只过滤未重用块的机制的缺陷。本文还提出了较少重用过滤器(LRF)结构来实现上述机制。LRF利用重用频率预测器从数据访问流中准确识别出较少重用块。同时,基于本文观察到的较少重用块的生命周期较短的特性,LRF将过滤出的块放入过滤缓存以充分利用,防止它们引发额外的缺失。实验结果表明,LRF在不对L2 cache的替换策略做任何修改的情况下,可提高有不同使用行为的程序性能。为一个传统结构的512KB LRU管理的L2 cache增加包含512单元过滤缓存的LRF,平均能够降低27.5%的MPKI,缩小LRU和OPT间74.4%的性能差距。比较表明,在相同的硬件代价下,LRF在性能上优于最新的其它方案。
其他文献
本论文围绕Internet下遥操作机器人系统的网络优化进行研究,主要研究内容为网络数据传输。首先,针对网络回路往返时延(RTT)的自相似性,提出基于自适应滤波的RTT预测算法;其次,
本论文首先围绕移动P2P网络的特点、信任管理在安全中的作用、信任管理问题的研究现状等问题进行了论述。通过借鉴国际上有关移动P2P网络技术的先进经验,为移动P2P网络设计了
学位
近年来,信息技术高速发展,数据采集和存储技术不断进步,国防科技化、现代化步伐不断加快,并且随着“智慧军工”概念的提出,对于军工领域信息化建设的要求也越来越高。各国对
随着全球信息化的迅速发展,信息已成为社会发展的重要资源,围绕这一资源所开展的全球性的竞争日趋激烈。“电脑有价,数据无价”是信息时代对数据重要性的认可,信息社会的发展
无线传感器网络是由大量廉价的传感器节点组成的无线自组织网络,它综合了计算技术、通信技术以及传感技术,能够通过各类集成化的微型传感器协作地实时监测、感知和采集各种环境
近几年来,随着数据库技术和网络技术的发展,许多领域都积累了大量的数据。巨增的数据背后蕴藏着丰富的知识,如何从这些数据中提取出对决策有价值的知识,成为人们关注的焦点。
单机批调度问题是最近十几年广泛研究的一个领域。在本文之中,我们首先针对给定n个工件和一个容量为B的单机并行批处理机器问题展开研究。每个工件Jj(j∈{1,2,…,n})具有一些
随着网络技术的发展和网络规模日益扩大,网络拓扑结构和网络设备日趋复杂,承载的业务种类也逐渐增多,这些都使网络中出现故障或性能问题的机会大大增加,网络监测面临更大的挑
作为一种新的信息获取方式,无线传感器网络(Wireless Sensor Networks,简称WSNs)已成为通信领域备受关注的研究热点。无线传感器网络是一种新型的无基础设施的无线网络,能够
随着计算机技术的发展,数字图像处理与分析技术在科学研究、工业生产、医疗卫生、教育、娱乐、管理和通信等方面得到了广泛的应用。边缘检测是图像处理与分析中最基础也是最重