面向Boom处理器的Gem5模拟器适配与误差分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:ding89629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RISC-V指令集架构是一种新生的开源精简指令集架构,拥有完整的工具链,支持众多软件,在高性能和低功耗计算上都有不俗的表现。美国加州大学伯克利分校在提出RISC-V指令集的同时,也基于该指令集设计了Boom处理器,并开源了该处理器设计平台。该平台能够生成Boom处理器硬件描述代码用于实际的处理器生产,也能生成官方模拟器用于评估处理器的性能特性。但是官方模拟器仿真耗时长,也不能像传统的模拟器如Gem5一样提供齐全的仿真插件。因此在Gem5平台上适配Boom处理器的模拟器,对于RISC-V指令集处理器的设计空间探索具有重要意义。本文分析了Gem5和Boom处理器间的总性能和微架构性能参数,详细分析了Gem5模拟器误差的来源并进行了适配。首先分析了Boom处理器流水线中主要模块的工作过程,在此基础上结合理论详细分析了造成性能差异的关键来源,即分支指令预测和Cache相关机制。然后在Boom处理器设计平台软件框架中添加Trace Profiling代码来获取分支预测失败事件数和Cache缺失事件数用于后续的适配工作。在适配过程中通过修改Boom处理器设计平台源代码解决了由于模拟器系统调用机制的实现差异而造成的Benchmark微架构无关参数不一致问题。论文在尽可能保证Gem5和Boom处理器可配参数一致的情况下完成了基本结构参数的适配工作。通过本文工作还发现了Boom处理器的分支预测器的设计异常及其造成的Cache缺失事件的异常,在与加州大学的维护团队沟通后,确认当前的Boom处理器设计中的分支预测机制存在官方尚未明确原因的Bug。本文选取计算密集型的Benchmark,分别在Gem5和Boom的官方模拟器上进行测试。结果表明:在尽可能保持两者结构参数一致的情况下平均执行一条指令所需要的Cycle数(Clock cycle Per Instruction,CPI)的平均相对误差降低了16.2%。
其他文献
人类社会正处于信息化向智能化的转变,传统计算系统架构和半导体工艺已经不足以应对计算数据的爆炸性增长。采用新材料、新器件、新架构的神经形态计算系统是当前的研究热点,
随着机器人技术在装备制造、航空航天、医疗救援等领域的广泛应用,高精度、高速度、低能耗机器人系统的发展受到诸多领域的重视。未来,机器人系统将代替人类从事纷繁复杂且精
CO2的化学转化是本世纪的研究热点之一,CO2作为温室气体的同时,也是一种储量丰富,廉价易得,极具应用潜力的绿色C1资源。由于CO2的结构非常稳定,开发高活性的催化剂用于二氧化
合成孔径雷达(Synthetic Aperture Radar,SAR)可以实现全天时、全天候的地面观测,广泛应用于民用和军用领域。常规单星单通道SAR系统受到最小天线面积约束,不可能同时获得方
发光二极管(LED)是利用半导体中导带电子跟价带空穴发生辐射复合将电能转换为光能的器件,与传统的白炽灯、荧光灯相比,具有高效、节能、长寿命等诸多优点。随着LED外延、芯片
在工程中,振动现象是不可避免的。被动隔振由于存在固有的缺陷,限制了隔振器的隔振效果。主动隔振系统与被动隔振系统相比,主动隔振系统对振动环境有较强的适应性,而且具有更
高速高精数控技术是装备制造业的关键技术,对制造业整体水平的提升起着至关重要的作用。在数控加工中,加工零件的复杂型面广泛将用连续微小线段描述。针对连续微小线段加工路
由于人口数量的剧增和人类活动的加剧,城市化不断扩张,越来越多的林地及农业用地等土地覆被类型转变为城市用地,与全球气候变化共同作用影响着地表蒸散发的改变。蒸散发是连
班级是学校德育工作的主阵地,班级管理是班主任工作的重点,做好这项工作,需要家、校、社会三结合。工作中,班主任与家长的沟通是必不可少的,特别是与违规学生家长的沟通更是
会议
众所周知,碳酸银是具有独特的电子能带结构的半导体材料,其被广泛的应用于催化反应和抗菌材料。近几年来,我们已经研究和发展了多种制备碳酸银的方法,例如室温沉淀法、机械化