基于分类的预取感知缓存分区机制研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:q87995210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预取技术通过提前将处理器所需的数据获取到缓存中,可以有效的隐藏内存访问延迟,但预取可能会给正常的缓存访问带来负面影响。此外,随着处理器从单核处理器发展到多核处理器,使得多个核心竞争最后一级共享缓存,缓存争用给预取技术带来了巨大挑战。对于多样化的应用程序工作集,如何既可以使用预取来隐藏内存访问延迟,又可以减少由于共享缓存竞争而导致的核间干扰成为热点问题。根据程序在运行过程中发出访存指令的频率,可以将程序分为内存密集型程序和非内存密集型程序。但,现有的预取机制和缓存分区机制都没有考虑非内存密集型程序的特征,无法提升其性能。因此,本文从非内存密集型程序的特性出发提出了的两种机制,既保证了内存密集型程序性能不受影响,又提升非内存密集型程序的性能。由于非内存密集型程序发出的访存请求远低于其他程序,硬件预取难以发现请求之间的联系,盲目的配置激进的预取会导致缓存污染,影响其他程序的性能。因此,为了改善非内存密集型程序的性能,本文提出了两种机制:(1)针对非内存密集型程序发出的访存指令少且局部性不强的特性,提出了基于分类的动态调整预取。该方法通过在运行时实时监控应用程序的特性,如预取的准确性,来动态的调整预取的激进程度。对于大多数程序,只要预取准确性大于预先设定的阈值,则提高当前程序的预取激进程度。但对于非内存密集型程序,为了防止过于激进的预取配置将其他潜在有用的数据块挤出Cache,会对非内存密集型程序的预取激进程度调整进行更加严格控制。此外,该机制还明确了何时打开预取器,若预取器处于关闭状态,但性能却依旧处于下降趋势,这有很大可能是因为内存访问延迟过大而导致的性能下降,此时应及时打开预取器,利用预取的优势,尽量减少应用程序的访存延迟,避免性能进一步损失。(2)针对非内存密集型程序容易受到其他程序干扰的特性,提出了基于分类的预取感知缓存分区。该方法通过实时监控多核处理器中运行的应用程序的类型,动态的选择最合适的缓存分区方式。当多核处理器中存在非内存密集型程序时,会在共享缓存中划出一个分区,避免其他程序对其的干扰。此外,该机制还考虑了预取友好型程序的特性,由于该类程序可以通过预取获得较大的性能提升,所以当处理器中存在预取友好型程序时,该机制也会在共享缓存中划出一个分区来避免其他程序对其的干扰。当多核系统中不存在这两种程序时,上述两类分区重新并入共享缓存中,尽量避免有效缓存容量减少给其他程序带来性能下降。该机制既弥补了预取机制忽视非内存密集型程序而导致的性能下降,又保证了预取友好型程序的性能优势。
其他文献
伴随着互联网技术的快速发展,基于定位的服务已经融入了我们的生活,变成日常生活中不可缺少的一部分。而随着移动设备的快速更新,许多的移动应用也嵌入了定位功能。在室外环境下,北斗定位系统,全球定位系统(GPS),伽利略系统等等基于卫星信号和雷达的定位技术已经非常成熟,并且由于具有抗干扰能力强,精度高,实时性好等特性,这些定位系统已经可以满足广大人民的日常生活需求。但是在人们经常活动的室内环境中,GPS等
随着集成电路技术的发展,工艺制程逐渐逼近极限,单核处理器已经进入了瓶颈期,多核处理器应运而生,受到了广泛的关注。任务调度算法是多核处理器并行计算能力能否充分发挥的关键因素之一。在对现有多核处理器静态任务调度算法广泛研究的基础上,以基于复制的任务调度算法作为研究对象。针对现有算法中存在的关键路径估算误差较大、解空间搜索不充分等问题,分别提出了面向异构多核处理器的带资源约束的任务复制调度算法TDSA-
随着处理器的发展,仅仅依靠处理器的单核性能来提升整体性能已经遇到了瓶颈,多核处理器的计算并行化是现在以及将来研究的热点,如何合理调度所有的计算单元,使得系统的计算能够并行化展开,提升计算单元的利用率将是提升多核处理器计算性能的关键。围绕上述问题,本文设计了一种面向异构多核计算系统的动态任务调度控制器。通过对系统计算行为的分析,主要实现了动态监控计算单元的负载情况、动态任务唤醒、任务并行性自动提取、
随着物联网和边缘计算的快速发展,智能终端设备由于在硬件资源与供电上受到较强限制,迫切需要满足低功耗要求的新型计算单元。作为一种具有广泛应用前景的高效低功耗计算范式,近似计算(又称为非精确计算)在图像处理、深度学习、物联网、边缘计算及实时信号处理等领域均已表现出明显优势。在这些具有良好容错性的应用中,近似计算通过产生近似的计算结果(足够好但不完全精确的计算结果),获得性能和功耗的大幅优化。因此,相比
随着云计算和安全多方计算等技术的发展,相关技术涉及的数据安全和隐私保护问题也日益凸显。全同态加密可以在无需密钥的前提下对密文进行任意操作,从根本上解决了云计算过程中所面临的数据安全和隐私保护问题,这使得全同态加密具有重要的理论意义和应用价值。基于环上带错学习(Ring-Learning With Error,RLWE)的密码方案具有结构简单、抵抗量子攻击等优点,这使得基于RLWE的密码学成为密码学
合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天候、全天时的特点,并且可获取高分辨率的地表图像。然而相干斑噪声影响了SAR图像的应用,因此SAR图像去噪成为了遥感图像处理中的一个重要研究方向。传统的去噪方法具有一定的局限性,无法有效实现去噪能力与结构保持之间的平衡。随着深度学习方法的不断发展,卷积神经网络(Convolutional Neural Network,C
基于全同态加密方案的机器学习可以有效解决因共享敏感数据带来的隐私保护和合法性问题。但原文经过加密之后,密文的数据位宽达数百万位,因此大整数乘法单元成为了加密神经网络训练和推理的基本工具。此外在航空航天等高端应用场合,利用大整数的高精度运算特性,将浮点数的尾数替换成大整数,可以有效解决浮点数运算精度不足的问题。因此,为了提高上述应用的性能,针对大整数乘法器进行创新设计是非常有必要的。本文的主要工作如
移动通信技术的迅猛发展促使通信需求的急剧增长,带来了对通信的数据速率和时间延迟的更高要求。与此同时,通信设备能耗的急剧增加也带来了绿色通信的迫切需求。为了支持日益繁荣的移动通信应用和实现无线通信系统的可持续发展,设计有效的低时延与低能耗的传输方案成为产业界和学术界的热点研究问题。本文分别从低时延与低能耗的角度,针对异构无线网中的常见场景,研究了采用全双工中继的低时延的云无线接入网(Cloud Ra
超声多普勒技术在临床医学实践中有着广泛的应用,如超声多普勒胎儿心率测量、超声多普勒血流速度测量、超声医学成像等。在传统的超声多普勒系统中,超声回波信号的解调多采用正交解调的方式,但是正交解调电路复杂,对外围电路要求高,而且数据处理的数据量大。针对正交解调存在的问题以及提取更为精确的超声多普勒频移信号,本文设计了一种单通道乘法器解调电路。本文的主要工作如下:1、提出了一种用于超声多普勒回波信号解调的
5G通信技术的快速发展和应用,加快了整个社会的信息化和智能化进程。作为智能交通系统(Intelligent Traffic System,ITS)重要组成部分的车载自组织网络(Vehicular Ad-hoc Networks,VANETs)也随之演进,表现为车辆的信息化、网络化和智能化程度越来越高。在此过程中,越来越多的计算密集型车辆应用不断涌现,对车辆自身有限的计算资源提出了严峻的挑战。为此,