一种降低片上多核系统缓存访问延迟的方法

来源 :南开大学 | 被引量 : 0次 | 上传用户:yiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
片上多核处理器(Chip Multiprocessor,CMP)将多个简单的处理核心集成到一个物理芯片上,相对复杂的单核处理器设计而言可以更加有效的利用片上资源,有利于发掘应用中线程级并行性。CMP的体系结构特征决定了其具有功耗低、设计和验证简单等优点。因此CMP成为处理器在今后一段时间内发展的趋势。为CMP系统中的多个处理核心提供与其计算能力匹配的数据传输是CMP系统面临的主要问题,缓存系统设计作为该问题的主要解决方案成为CMP系统研究的热点之一。   共享型的二级缓存设计可以更加有效的利用片上缓存,具有较低的缺失率,是CMP系统缓存设计的主要选择。NUCA实现的共享型二级缓存设计在逻辑上共享地址空间,但是物理上由多个二级缓存模块组成,该方式的缓存设计可以提供较高的片上缓存访问带宽,避免了单一的二级缓存成为CMP系统的瓶颈。但是NUCA实现的共享型二级缓存的平均访问延迟很大程度依赖于数据在缓存模块之间的分布。   本文提出了一种基于进程调度对NUCA实现的缓存设计访问延迟进行优化的方案(Cache Access Latency Optimization Scheme based on Process Scheduling,CaLoSPS)。CaLoSPS方案通过添加硬件计数器实现对应用访问缓存规律的收集。CaLoSPS方案在操作系统已有基础上对调度模块进行改动,增加了针对缓存访问规律的中粒度调度模块。中粒度调度模块以应用对缓存模块的访问规律作为输入,根据缓存访问规律对进程进行调度,并将进程迁移到距离其经常访问的缓存模块较近的处理核心上执行从而降低进程访问缓存的平均延迟。   CaLoSPS方案根据进程对缓存的访问规律对进程调度和迁移,可以降低CMP系统中处理核心访问缓存的平均延迟。同时,CaLoSPS方案减少了数据在片上网络中的传递。仿真结果表明,CaLoSPS方案可以将缓存访问延迟平均降低10.65%,对某些特定基准测试程序最高可以降低25.89%;对片上互连网络的延迟平均可以降低19.59%,对某些特定基准测试程序最高可以降低35.41%。
其他文献
秘密共享是实现信息安全和数据保密的重要手段,它在防止重要信息和秘密数据的丢失、毁坏、被恶意修改或被不法分子利用中起着非常关键的作用,已经成为现代密码学领域中一个重
基于组件的人脸识别方法有效地克服了基于全局方法难以解决的局部遮挡、姿态变化等问题,但是在进行识别之前,需要检测和定位组件。在现有的基于组件的人脸识别方法中,实现组件定
随着计算机和网络技术的应用与普及,越来越多的高校都建立了计算机机房,并通过校园网连接到Internet上,主要承担学校计算机文化基础课程、计算机语言、毕业设计、网络实践和
语义Web是当前Web的扩展,它为Web信息附加计算机可理解的语义,实现Web数据处理的智能化。描述逻辑被视为语义Web的主要逻辑基础,它赋予Web信息以形式化的语义。随着语义Web的发
改革开放以来,国民经济迅猛发展。随着人民物质生活水平的不断提高,对一个家庭而言,拥有一辆甚至多辆汽车,已经不是遥不可及的梦想。根据国家统计局最新发布的《2014年国民经
智能卡操作系统(Chip Operating System,简称COS)是智能卡在软件层面的核心技术。其研究和开发对智能卡技术的发展和普及有很大的促进作用。自动指纹识别技术是利用人类指纹
人工免疫系统是借鉴生物免疫系统中的信息处理机制而设计的模型和算法,提供了一种解决复杂计算问题的新颖途径。目前,人工免疫系统在诸如故障检测、数据挖掘、优化等多个领域
无线传感器网络是集信息采集、信息传输、信息处理于一体的综合智能信息系统,在军事国防、生态环保、医疗护理、智能交通等诸多领域都有广泛的应用前景。然而,由于工作环境和
无线自组网是由多个无线移动节点组成的一个多跳的,无固定架构的网络。由于无需任何固定的基础设施就能实现网络的快速展开,因此Ad hoc网络非常适用于战场、救援、等特殊场合
近年来,数字技术和计算机网络的迅猛发展,使数字多媒体(数字图像、数字音频、数字视频及三维计算机图像)的应用取得了惊人的进展,给人们的工作和生活带来了极大的便利,但是也