基于SPM的访存加速器设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:white2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机内存系统是影响体系结构、系统软件和应用软件效能的最重要因素之一。过去几十年,由于处理器与内存之间的性能差距越来越大,内存系统已成为制约系统性能的瓶颈。近几年,高并发的数据处理程序越来越多。这类程序会向内存系统发出大量高度并发的访存请求,当这些访存请求局部性不足够好时,就会导致大量的Cache Miss,这时候MSHR(Miss Status Handling Registers)就可能会成为程序性能的瓶颈。MSHR是Cache中用于记录已经发向内存的读请求的一组寄存器,MSHR支持的未完成读请求的个数,是决定访存系统并发性的关键因素之一。而目前,典型处理器的MSHR支持的未完成读请求的个数一般较少,因此会成为这类高并发应用的瓶颈。  本文针对这个问题,提出了访存加速器的解决方案。访存加速器致力于支持更多的未完成读请求,从而提高系统的访存并发性。作者设计的访存加速器,支持的未完成读请求的个数可比MSHR多一个数量级。访存加速器位于CPU和内存之间,自行管理大量的内存读写请求。访存加速器内含一块CPU可见的空间,软件将访存请求写入,然后加速器将访存请求转发至内存。Zynq是Xilinx公司提供的一款集成了ARM核和FPGA的芯片,其硬件可编程性和FPGA可直接访问ARM核内部SPM(Scratchpad Memory)的特点,为我们在其上实际实现访存加速器提供了可能。作者在Zynq芯片上,以FPGA硬件编程的形式,实现了设计的访存加速器。使用ARM核内SPM作为CPU可见的空间。为了测试实现的访存加速器的效果,作者将HPCC RandomAccess Benchmark移植到了该平台上。通过分别运行原始版本和加速器版本的HPCC RandomAccess,作者获得了对比评测数据,并对评测结果进行了分析。
其他文献
随着在线社交网络平台的大量涌现以及用户参与度的持续增长,我们已步入在线社交的信息化时代。社交网络中的关键人物处于网络中心或桥节点的位置,一方面,其言论具有代表性,反映了
新材料的开发和生产已经成为一个国家工业化快速发展的制约因素之一。几十年来,先进材料的研发以及利用它们所设计出的新产品使得以美国为代表的发达国家在全球保持了强有力的
近些年来,互联网基础设施发展逐渐陷入僵化形势,通过研究创新促使互联网朝良性方向演化是未来网络发展的唯一出路。未来互联网试验床为下一代互联网体系研究提供了规模可观的试
为了提高室内覆盖质量,满足用户不断增长的业务需求,LTE中引入了家庭基站技术。家庭基站的引入提高了系统容量,增强了网络覆盖,减轻了宏网的流量压力;同时也带来了干扰,频繁切
随着数据挖掘、模式识别等领域的发展,机器学习越来越受到人们的重视,作为机器学习领域的一种重要算法,支持向量机由于其优良的性能指标得到了广泛的应用。而对于面向服务器和高
量子化学(Quantum Chemistry)是应用量子力学(Quantum Mechanics,QM)的基本原理和方法研究化学问题的一门基础科学,用以研究分子体系的微观结构、性能等。由于受到QM计算复杂度和
空间科学是指利用航天器研究发生在日地空间、行星际空间及至整个宇宙空间的物理、天文、化学和生命等自然现象及其规律的科学。一直以来,太阳的活动对地球有显著的影响,日冕物
网页关键信息抽取是指从网页中抽取关键信息。关键信息是该网页区别于其他网页的信息。网页关键信息抽取在信息检索、辅助移动设备用户浏览、网络数据分析等方面有非常广泛的
随着互联网技术和视频技术的发展,网络视频的数量呈现出爆炸式的增长速度。台标作为网络视频的一个最显著标志之一,对于视频检索、视频监管均具有重要的应用价值,同时视频台标检
随着通信技术的快速发展,视频的传输和扩散越来越便捷。随之而来的版权保护问题也得到了越来越多的关注。视频水印就是常见的.有效的版权保护方法。为了能够有效的保护版权,