面向多核处理器的内存控制器模拟和优化技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:goeas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“存储墙”问题一直是制约计算机系统性能的关键因素。随着多核处理器成为主流,单个芯片上可以同时运行的线程个数越来越多,这些线程同时竞争有限的访存资源,使得内存控制器面临的访存压力越来越大。  在计算机架构设计中,运用模拟的方法,通过运行实际应用程序对目标性能进行定量分析是非常重要的环节。如何进行高速有效的模拟对于学术界和工业界都是非常重要和有意义的,同时也是研究者和工程人员面临的一大挑战。本文针对多核处理器内存子系统研究中面临的模拟和优化两方面的挑战,从工程实践的角度出发,分别进行了有意义的研究。本文的主要贡献和创新点如下:  1.提出并建立了一套完整的存储系统模拟平台。本文建立的模拟环境,包括基于FPGA加速的全系统模拟平台和基于trace的软件建模、RTL级仿真环境。本文提出的混合真实处理器核和仿造处理器核的片上多核处理器存储系统模拟方法,结合了FPGA原型验证和trace仿真的优势,能够增加FPGA的模拟规模,大幅提高FPGA平台的模拟速度。基于trace的软件建模和RTL级仿真,可以加快存储系统的设计空间探索,加速优化迭代的过程。通过去除不必要的模拟对象,本文进一步提高了RTL级仿真的速度。  2.提出并实现了一种智能的内存控制器端预取。本文基于stream buffer预取,提出了流缓冲延迟替换和动态调整预取激进程度的方法。以上方法可以提高预取数据的利用率,并能够根据访存压力在预取准确度和预取覆盖率之间达到动态平衡,从而优化预取的性能。实验结果表明,本文设计的stream buffer预取可以将SPECCPU2006的平均性能提高3.7%,将STREAM程序的性能提高34%。  3.提出并实现了一种智能的DRAM页面管理策略。通过对DRAM的页面管理模型进行深入地理论分析和实验验证,本文提出了一种接近最优的DRAM页面管理方法。该方法基于开页策略,同时只在必要的时候进行猜测性关页。本文提出了一种简单有效的关页预测算法,并在此基础上,提出了一种利用列地址到达页边界的关页预测方法。实验结果表明,以上方法可以优化DRAM页面管理的效率,提升内存控制器的性能。  上述部分工作在龙芯3B1500、3A2000处理器中得到了实际应用。
其他文献
面对日益复杂的设计要求和有限的设计时间,如何有效地进行性能分析评估以指导完成SoC的设计,是摆在每一位SoC设计人员面前的问题.仅仅依赖直觉,经验和一些基础规则来完成SoC
地理信息系统(GIS)是人们将计算机引入地理相关学科后出现的一项新的技术。随着计算机技术的发展与普及,GIS技术也逐渐成熟。一方面,利用二维的图形图像描述与分析现实世界已经
基于视频的人体运动分析和理解是近年来计算机视觉十分活跃的一个研究方向,不仅具有重要的学术研究意义,而且有着广阔的应用前景.人体运动分析技术在智能视觉监控、高级人机
无线传感器网络是由大量静止或移动的传感器节点以自组织多跳的方式构成的网络,其目的是协作地感知、采集、处理和传输网络覆盖区域内感知对象的监测信息。传感器网络具有分布
学位
利用计算机通过某些方法自动地从海量的网络信息中抽取出我们感兴趣的有价值的形式化的知识,即文本挖掘(Text Mining),已成为人们迫切需求的一项技术,而且已经成为人工智能研
进入信息化时代后,企业间的合作方式发生了很大变化,其中一种重要的方式就是“供应链合作”方式。一个供应链中可能涉及到相当多的企业,因此,“供应链合作”方式的成功与否取决于
当前,恶意代码给互联网带来了严重的威胁,同时全面向政治、经济等领域渗透,甚至可以成为网络战的武器,因此研究恶意代码及其对抗技术具有重要意义。本文对恶意代码的机理进行了详
服装动画是角色动画的重要组成部分。利用服装动画技术,能够生成逼真的服装运动,使得虚拟角色整体具有非常细腻真实的动画效果。目前,服装动画技术在电影电视、游戏娱乐、虚拟现
随着互联网的蓬勃兴起,企业应用从传统的客户机/服务器模式开始面向互联网。作为企业级应用程序解决方案之一,J2EE被认为是当今可用于企业软件开发的最佳平台,J2EE简化了基于工
随着机群系统规模的扩大,可靠性问题已成为制约机群系统应用的重要障碍.目前,针对机群系统可靠性的相关研究主要分为两类.一类以部件冗余为基础,以提供不间断服务为目的的高