异构内存环境下末级缓存优化机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hms0741
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、人工智能以及移动互联网产业的深入发展,数据规模呈现爆发式增长。应用程序和计算系统开始通过将更多的数据存储在内存中来提高数据传输、存储以及运算的效率,这也使得对大容量主存的需求变得愈加迫切。传统的动态随机存取存储器(Dynamic Random Access Memory,DRAM)技术在内存容量扩展时面临着价格高、密度低以及能耗高等挑战,使其难以匹配日益增长的数据规模。新型非易失性内存技术(Non-volatile Memory,NVM)的发展,凭借着价格低、密度高以及静态功耗低等优点,受到了越来越多的关注。然而,相比DRAM,当前NVM技术还存在着写时延高和写功耗高等缺点,使用NVM完全替代DRAM在短时间内还不可行。结合DRAM和NVM两者优点构建的异构内存架构,成为了内存容量扩展的一个极具竞争力的解决方案。在异构内存环境下,由于DRAM和NVM的内存访问时延相差较大,末级缓存不命中时,内存访问开销是不一致的。这种不一致使得传统的末级缓存优化机制效率较低,无法适用于异构内存系统。为了解决这个问题,在缓存替换、缓存旁路以及缓存分配三个方向对传统的缓存管理策略进行优化,有效地降低了异构内存系统的访存开销,显著地提高了异构内存系统的吞吐率和公平性。内存访问时延的不对称性使得末级缓存命中率不再能够有效地评估末级缓存的效率,传统基于提高缓存命中率的缓存替换策略在异构内存下也面临着效率不高的挑战。针对这个问题,将末级缓存不命中后访存开销不对称性考虑进去,利用平均内存访问时间作为异构内存下末级缓存效率的度量标准,并提出了一种缓存不命中开销感知的末级缓存替换策略MALRU。MALRU策略优先替换访存时延低的DRAM缓存块来减少末级缓存不命中开销,同时频繁被访问的缓存块驻留在末级缓存中来减少缓存颠簸的发生。实验结果表明,与异构内存系统中最先进的HAP策略相比,MALRU策略将异构内存系统的性能提高了13.1%。由于内存访存时延受到数据分布的影响,应用程序之间对系统资源的竞争不再是影响异构内存系统吞吐率和公平性的唯一因素。传统的末级缓存旁路策略没有将异构内存的特点考虑进去,无法准确地判断缓存块的权值以及异构内存下处于竞争劣势的应用程序。针对这个问题,提出了一种异构内存下缓存-内存协同的末级缓存旁路策略CMC。CMC策略指出了异构内存系统中影响系统公平性的三个主要因素,并提出利用访存请求的平均服务时间来量化异构内存下应用程序的竞争力。在内存层,CMC策略优先调度轻量级的应用程序来提高系统吞吐率,并通过优先调度平均服务时间高的应用程序来保证系统的公平性。在末级缓存层,CMC策略利用应用程序在异构内存下的访存行为指导末级缓存旁路僵尸缓存块,进一步提高了异构内存系统的吞吐率和公平性。实验结果表明,与经典的TCM策略相比,CMC策略对异构内存系统吞吐率和公平性的提升分别高达8.76%和8.99%。异构内存环境下,由于NVM访存时延是DRAM的数倍,末级缓存不命中时一些写请求比例高的应用程序会被阻塞地更加严重,加剧了系统吞吐率和公平性的下降。传统的末级缓存分配策略需要引入额外的硬件或者对现有的硬件进行较大的修改,无法应用到现有的商业处理器中。针对这个问题,利用高速缓存分配技术(Cache Allocation Technology,CAT)在真实物理机器上为应用程序分配末级缓存空间,提出了一种异构内存环境下基于应用程序聚类的末级缓存分配策略ACCA。ACCA策略优先满足内存访问轻量级和数据局部性友好两类应用程序对末级缓存空间的需求,显著地提高了异构内存系统的吞吐率和公平性。此外,ACCA策略通过在处理器运算和内存访问两个维度上对应用程序在异构内存下的竞争力进行量化,为写请求比例高的应用程序分配更多的末级缓存可利用空间。实验结果表明,与最先进的Dunn策略相比,ACCA策略分别将异构内存系统的吞吐率和公平性提高了9.83%和43.19%。
其他文献
光催化分解水制备氢气被认为是一种很有前途的技术,光催化分解水能够利用太阳能将水分解成清洁的化学燃料氢气。尽管在过去的几十年里光催化制氢技术取得了巨大的进步,但是由于太阳能到氢的能量转化效率较低,这项技术仍然处于概念验证阶段。实现光催化分解水工业化应用的最大障碍之一是光生电子-空穴对的复合率过高。引入助催化剂不仅可以降低氧化还原反应的过电位,还可以促进电子空穴的分离,能够极大地提高光催化分解水反应速
本文研究了两个非线性的偏微分方程:带延迟的Degasperis-Procesi方程和电导-电阻对称的神经元模型。它们都是研究物理现象和生物现象的重要数学模型。在本文中,我们主要利用几何奇异摄动和不变流形的理论、相图分析、爆破技术等工具证明了这两个方程孤波解的存在性。第二章我们给出了本文中需要用到的一些分析工具:Fenichel的奇异扰动理论、Melnikov方法、交换引理以及爆破技术。在第三章,我
光催化CO2还原技术通过利用清洁丰富的太阳光来驱动“温室气体”CO2的还原转化实现碳资源再生,是环境控制和清洁能源利用的理想途径之一。高效光催化剂的开发是推进光催化CO2还原技术应用的关键。Ti O2由于其良好的光稳定性、低成本和环境友好,成为最受欢迎的光催化剂之一。然而,Ti O2这类传统无机半导体材料由于自身比表面积低、缺乏与CO2匹配的孔隙,因而光催化CO2还原效率较低,特别是在复杂废气环境
人体生物样本库以造福人类健康为宗旨,在探索基因与疾病、基因与环境的关系以及解决人类疾病问题方面意义重大,但是其产生和发展也引发诸多伦理问题。其一是人体生物样本库的知情同意问题。它与以往生命伦理学及医学伦理学中的知情同意有所不同。笔者认为这些伦理问题主要包括:知情同意对个人自主性或者自主决定权的挑战;再次同意的问题;知情同意的形式化和过度化。针对这些特殊困境,笔者认为应该始终坚持人的主体地位,尊重人
随着摩尔定律的发展,基于MOS结构的存储器件逐渐逼近物理极限。同时,尺寸微缩和工艺迭代的成本壁垒迫使产业界寻找新的存储方案。在众多新型存储技术中,相变存储技术以其优越的性能和三维堆叠能力备受瞩目,被视为最有可行性的存储级内存方案。为了充分发挥相变存储器的性能优势,存储单元必须能够在产品的使用寿命内可靠地工作。基于相变存储器的功能定位,相变存储器在操作性能提升的同时,需要实现比NAND Flash更
学位
校园建筑能耗包含建筑内部能耗和建筑外部能耗,内部主要耗能设备为供暖通风与空气调节系统(Heating,Ventilation,and Air Conditioning system,HVAC),外部主要耗能设备为充电桩(Charging Station,CS)。能耗优化可以降低用电成本,为校园建筑提供一个高效、舒适的环境。然而,高效、舒适的环境温度和最节能的环境温度之间产生了博弈行为,本文通过调节
云块存储(Cloud Block Storage,CBS)作为一种新兴的通用块存储服务,具有高性能、高可扩展性、高可靠性、通用性等优点,倍受业界关注。目前,各大云供应商都面向租户提供了云块存储服务,支持着各行各业的基础数据存储。提升云块存储系统服务端缓存效率是改善其访问性能的有效手段,但面临诸多挑战。首先,多种类型的应用数据存放在云块存储系统,其访问负载的复杂性及动态性使得已有算法的有效性难以保证
随着节能减排的法规日益严格,湍流预混燃烧因为其清洁高效的特点被广泛使用于各类先进燃烧装置中。然而在实际应用中发现,湍流预混燃烧过程常会受流体动力学不稳定性(Darrieus-Landau,DL不稳定性)的影响而偏离预设工况,从而导致热效率降低、排放恶化等情况,这为先进燃烧技术的开发带来诸多挑战。所以,目前亟需解决的科学问题是湍流预混燃烧中的DL不稳定性与湍流相互耦合作用的定量分析问题,为揭示DL不
光学显微镜由于光学衍射极限的限制通常难以满足人们探究200 nm以内微观世界的需求。超分辨成像技术的出现使得人们有机会采用不同的方法绕过光学衍射极限的限制,让光学显微镜也能拥有媲美电子显微镜的超高分辨率。在众多超分辨成像技术中,基于单分子定位的超分辨成像技术(通常简称为超分辨定位成像)利用荧光探针的荧光闪烁行为实现对纳米结构单分子级别的定位。目前,常用的超分辨定位成像探针主要包括荧光蛋白和有机荧光