处理器高性能发射队列设计与优化

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:muteng12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大规模集成电路设计技术的发展和计算机体系结构的创新,处理器的性能提升迅速。在计算机体系结构的创新中,指令级并行对处理器性能的提升有重要意义。指令级并行主要包括流水线技术、多发射技术和乱序执行技术。流水线技术提升处理器频率;多发射技术通过空间重复性使处理器同时执行多条指令;乱序执行尽可能消除消除指令间的相关性,提高流水线效率。发射队列是多发射技术和乱序执行技术的关键硬件,是流水线中的关键一级,对乱序执行超标量处理器性能有很大影响。本文基于RISC-V架构BOOM处理器的发射队列,提出发射队列的优化方案。首先详细分析发射队列结构和组织形式,理清发射队列与其他流水级的关系。BOOM处理器的发射队列采用基于压缩队列的position-based发射策略,采用分组发射队列结构,采用在发射流水级之后读取寄存器的结构。然后结合发射队列结构和前后流水级情况,提出对发射队列的优化方案,主要包括以下五个优化点:1.根据BOOM处理器访存系统的特点,加入LOAD指令推测发射机制,提升发射队列唤醒能力,在还没有得到LOAD指令执行结果时推测的唤醒发射队列中相关的操作数,下一周期根据LOAD指令是否缓存命中的信息决定推测发射的指令是否继续进行;2.优化发射选择逻辑,增添转移指令专用的发射端口与指令通路,将分支执行单元作为一个独立的功能单元,提升转移指令在定点发射队列中的优先级,使对处理器性能影响较大的转移指令得到优先处理;3.优化寄存器重命名与发射队列之间的调度逻辑,判断每一周期需要调度的指令是否可以完全进入各个发射队列,提升发射队列的硬件利用率并减少流水线停顿;4.优化发射队列中的指令上移逻辑,为每个发射槽设置空满标志位,并行的计算发射队列中每条的上移量,消除关键路径,提升频率;5.优化发射选择逻辑,同时选出多组符合要求的指令,然后二次筛选出最终要发射的指令,消除关键路径,提升频率。最后通过仿真验证平台和FPGA测试证明本设计实现了预期功能点。本设计使用Xilinx Virtex-7系列FPGA VC709运行SPEC CPU 2006测试集进行测试,结果表明优化后的处理器运行SPECint基准train输入集的IPC提升了3.52%,运行SPECfp基准train输入集的IPC提升了2.76%;定点发射队列在TSMC 28nm CMOS工艺下可以达到1.916GHz的频率,比原设计的频率提升了53.28%,面积增加了5.02%,功率增加了35.88%。该设计可以用于BOOM处理器和与BOOM处理器有相似发射队列结构的其他RISC-V处理器,具有一定的工程应用价值。
其他文献
改革开放以来特别是党的十八大以来,党中央一贯坚持社会政策的普惠性、基础性、兜底性。基本养老保险制度是社会保障制度的重要组成部分,是保障与改善民生的根本性制度,关系着人民幸福与国家长治久安。党的十九大报告指出人民期盼有更可靠的社会保障。这对基本养老保险制度改革发展提出了新的要求。基本养老保险基金是养老保险待遇发放的主要来源,能否足额发放,直接关系着参保人员年老退休后的基本生活质量。随着基本养老保险基
近年来,复杂的金融环境使商业银行无法再单纯地将存贷利差作为主要的盈利模式,其业务经营也受到了前所未有的挑战。商业银行纷纷转向多元化经营通过拓展中间业务获得更多的非利息收入,同时传统的资产负债业务受利率市场化、互联网金融等影响需要靠调整产品种类期限来维持利息收入水平,至此收入结构已不知不觉发生了巨大的变化。收入结构的变化主要是业务品种的变化和创新引起的,在经济发展新常态形势下,新业务带来收益的同时也
纳税信用管理是保障国家税收来源的基本手段之一,是国家宏观调控的重要方式。完善的纳税信用管理需要税收法律作为保障,做到应收尽收,从体制机制上最大限度地减少税收流失,增
近年来,随着城市计算的快速发展,智慧交通系统已经成为基于位置服务的热点研究领域。地铁流量预测作为其中一个重要的研究方向,不仅能为城市地铁的智能调度和规划提供重要的决策基础和数据支持,还能够满足出行用户对规避地铁站点拥塞的强烈需求。当前的城市地铁虽然普遍拥有调度和管理方案,但仍然暴露了地铁与乘客的供需不匹配等问题,造成安全隐患。若能应用一套地铁流量预测系统,预知地铁站点的客流量情况,将极大提高地铁线
节约能源和降低能源强度是中国在“十三五”规划中明确的目标任务。本文构建了基于能源投入的子向量距离函数,运用DEA模型测算环境规制成本效应,测算出2002年到2016年中国30个省市区的环境规制成本,分解环境规制下的地区能源消耗(能源投入)量、能源强度变化,并以此为基础,运用LMDI方法对中国整体能源强度变化展开更详尽的分解。结论如下:第一,中国整体环境规制成本自2005年起总体上呈上升趋势,环境规
随着中国经济的发展和中国社会开放脚步的加大,英语作为世界上最广泛使用的语言和重要的交际工具,越来越得到国人的重视,英语教育机构也如雨后春笋般层出不穷。但是英语培训行业也存在一系列普遍性的问题亟待解决,如培训机构的市场定位不准确、培训项目过于传统和趋于同质化、跟风等问题。英语培训机构不仅面临着机构发展定位不明确的问题,营销策略不合理,,缺乏科学的管理体制和长远的营销规划,这些因素都成为影响和制约英语
车联网是智能交通系统的重要组成部分,能够实现车辆间、车辆与行人、车辆与基础设施间各类信息的交互,从而预知潜在危险情况,提升城市交通安全。其中,基于现有蜂窝移动通信的蜂窝车联网(Cellular Vehicle to Everything,C-V2X),作为重要的车联网候选技术之一,其系统性能研究对于车联网的理论发展与实际系统部署都具有重要的指导意义,已成为业界关注的焦点。为此,本文围绕C-V2X的
本文以纳西族传统文化保存较好、礼物习俗特点鲜明的云南省迪庆州香格里拉市三坝纳西族乡白地村民委员会古都自然村作为调查点,对古都村的社会组织和礼物流动进行了较深入的
随着时代的发展,个人信息在人们生活中占着越来越重要的地位,指纹、虹膜、和面部成为主流的个人身份识别特征,其技术成熟、应用广泛。而声纹和指纹、虹膜、面部一样具有唯一性,更具有经济性、便捷性的优点,是一种极具潜力的生物识别方式。移动设备是常用的识别载体,以上识别方式最终在载体上发挥它的实际价值和效用,安卓是移动设备常用的系统,其实用的经济前景较好,本文以安卓为平台,研究声纹识别模型(Voiceprin
当前,创业活动已经成为拉动世界经济发展的重要增长极。近年来,随着中国经济的质态不断优化,全民创业蔚然成风。常州市作为江苏省改革开放后最早富起来的一批城市,创业底蕴深厚,市民参与创业的热情高涨,私营企业和个体工商户分别达到17.34万户和35.27万户,个私注册资本(金)超过1万亿元,参与创业活动的人群和资金总量相当可观。常州市创业环境良好,创业平台数量、创业融资规模、专利申请量等都增长迅速。同样快