多核处理器下基于Cache划分的替换算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：ivanny

【摘要】

：

随着高性能计算机的发展，片上多核日渐成为高性能计算的发展趋势。多核系统片上集成的核数也越来越多，由于常见的多核系统共享片上最后一级Cache，因此，片上最后一级共享Cache容量

【作者】

：

李成艳

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2013年期

【关键词】

：

多核处理器 Cache划分 LRU替换算法块粒度动态划分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着高性能计算机的发展，片上多核日渐成为高性能计算的发展趋势。多核系统片上集成的核数也越来越多，由于常见的多核系统共享片上最后一级Cache，因此，片上最后一级共享Cache容量也越来越大。众所周知，片上Cache是计算机存储系统的层次结构中，介于中央处理器和主存储器之间的高速小容量存储器。它是存在于主存与CPU之间的一级存储器，接近于CPU的速度，主要用来缓解CPU和内存的访问速度差异。随着多核下应用工作集的增加，CPU对访存数据的需求量的加大，使得当前的Cache替换算法与最优替换算法之间的差距明显加大，替换算法成为管理最后一级共享Cache的研究热点。命中率是Cache替换算法有效性的最重要的评价指标，因此如何提高命中率，有效利用Cache空间是提高计算性能的重要因素。　　本文对二级Cache替换算法以及当前日渐流行的多核系统研究现状进行分析发现，传统的单核系统多使用最近最少使用替换算法(Least RecentlyUsed，LRU)，LRU替换算法的理论依据是程序的局部性原理:即CPU访问存储器时，无论是存取指令还是存取数据，所访问的存储单元都趋于聚集在一个较小的连续区域中。因此，在每次选择逐出块时，通常选择最近最少使用的那个块调出内存，这已经成为业界的一个标准。但是实验证明，LRU替换算法在多核环境下，与最优替换算法之间的性能差距非常大。多核共享二级Cache对替换算法带来更多的要求，尤其二级相联度越来越高，多核下应用的工作集加大，以及一级Cache对数据的过滤，在一定程度上削弱了对二级Cache数据访问的局部性，给LRU替换算法的性能带来一系列的不良影响。　　针对以上情况，本文结合多核系统的特点以及现有的单核环境下的替换算法进行研究，提出了基于平均划分的多核共享Cache替换算法FLRU-A(Frequencybased LRU with Partition)以及基于块粒度动态划分的FLRU-B替换算法。FLRU-A算法考虑到多核竞争访问二级Cache的现状，将二级Cache进行平均划分，在此基础上使用基于频率的LRU改进替换算法，选择最优的Cache替换块，达到降低缺失率的目的。但由于静态划分不能适应应用程序的访问变化，同时列划分粒度较粗，不能充分的利用Cache空间，本文又提出了基于动态块粒度划分的FLRU-B(Frequency based LRU with Block partition)替换算法。在平均划分的基础上，通过不同核之间的Cache块窃取， Cache使用率高的核可以窃取Cache使用率低的核的Cache块，同时，当Cache使用率低的核变为Cache使用高的核时，第一时间收回自己的Cache块，从而达到充分的考虑各个核之间的访问特点，实现动态的块粒度划分，进一步充分利用Cache空间的目的。关键是因为两种算法增加了复杂性的，本文又对两种算法进行了功耗的计算和对比，发现两种算法在降低缺失率的同时，并没有明显的增加能量消耗，从而达到了性能与功耗之间的平衡。实验结果表明，本文提出的FLRU-A算法相比传统的LRU算法缺失率降低了26.59％，IPC则提升了13.59％。本文进一步改进的块粒度动态划分下基于频率的FLUR-B算法相比较传统的LRU算法性能提高更大，缺失率降低了33.72％，而IPC则提升了16.59％。两种算法在性能提升的同时，并没有明显的增加能量的消耗。因此本文提出的动态块粒度划分下基于频率的FLRU-B替换算法在提高处理器性能方面有很大的提高。

其他文献

一种内存虚拟化优化方案

多年来，尽管在减少虚拟化虚耗的问题上，业界有着不懈的努力，但是内存虚拟化的额外开销过大的问题对于某些应用程序仍然过于显著，而且至今还无法找到解决该问题的高效且低廉的方案

学位

内存虚拟化内存管理优化方案应用程序影子页表硬件辅助页表

基于典型相关分析的人脸表情识别方法研究

人脸表情识别在军用和民用领域有着广阔的应用前景，是目前的一个非常活跃的研究领域，其目的是让计算机等机器能够自动辨认出人脸表情。由于人脸表情的复杂和微妙等特性，因此会使

学位

人脸表情识别典型相关分析协方差矩阵稀疏权值自适应权值

可信加密磁盘的设计与应用

随着信息技术突飞猛进的发展和电脑的广泛普及，使得信息安全越来越受到人们重视。目前，针对信息的保护主要依赖于系统的安全和网络的安全。本文主要是针对系统中文件的安全进行

学位

虚拟磁盘透明加解密USBKey可信计算

应急虚拟训练游戏引擎关键技术的研究与实现

近年来，教育游戏己经开始应用于基础教育的各个学科之中，并取得了一定的成绩而在国内对教育游戏研究还处于起步阶段，教育游戏在学科教学中的应用也只限于数学英语历史等几门学科

学位

游戏引擎场景建模编辑

基于行为分析的木马攻击检测系统研究与实现

随着信息技术的飞速发展，Internet已成为人们工作生活中不可缺少的重要部分。同时，Internet面临的安全形势严峻，尤其是以木马攻击为主的网络攻击行为危害日益严重，由此造成的经济

学位

木马行为分析告警聚类序列识别木马攻击检测可信度分析数据挖掘

面向作业组的MapReduce系统设计与实现

在以搜索引擎与社交网络为代表的互联网应用为我们带来大规模数据资源的今天，MapReduce系统作为一个同时具有高效性、便捷性、容错性等特点的分布式计算系统，越来越广泛地被应

学位

作业组应用MapReduce系统数据倾斜区间划分作业调度并行化

图像匹配的多阶特征线性分配模型研究

在计算机视觉领域中，图像匹配的研究主要包括设计优异的图像特征描述方法和良好的匹配策略两个方面。提出健壮性较强的图像特征描述是获得其较高匹配准确度的有效策略，也是定义

学位

图像匹配多阶特征最优化匹配模型机器学习目标函数最优化Bundle Methods正则风险最小化

一种支持故障注入的Petri网仿真建模方法研究与应用

随着信息技术的发展，仿真技术已广泛渗入到航空航天、军工制造、医疗卫生、金融、社会等各个领域，在诸如型号设计等高复杂性领域已成为不可或缺的重要支撑技术。在传统的仿真环

学位

仿真建模Petri网故障注入变异算子系统可靠性

一种改进的模糊访问控制模型

随着网络技术的快速发展，人们对信息系统的访问需求越来越强。网络系统的安全性成为了用户和开发者共同关注的问题。访问控制是通过某种途径显式地准许或限制访问能力及范围的

学位

访问控制使用控制模型模糊集网络安全

引文作者的人名消歧方法研究

文章写作时经常要借鉴以往的文献，并且在文章的参考文献部分(Reference)列出借鉴过的文献，这些列出来的文献条目就叫做引文(Citation)。对于数字图书馆来说，如何有效利用这些引

学位

人名消歧引文作者层次聚类数字图书馆相似度向量

多核处理器下基于Cache划分的替换算法研究

与本文相关的学术论文