基于“龙腾R2”微处理器的SMT结构的研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:SparrowHawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文的研究内容基于国家某预研课题,目的是研究RISC微处理器的体系结构和设计方法,设计兼容于PowerPC指令集的嵌入式微处理器。 课题组殴计的32位嵌入式RISC微处理器“龙腾R2”芯片,指令系统和接口时序与Motorola公司的PowerPC750微处理器兼容,微体系结构采用自主设计的技术路线,采用自顶向下的设计方法,目前芯片已经流片成功,主频达到233MHZ。本文作者在课题研究中,参与完成了该处理器的定点流水线的设计和验证工作。在该项目的基础上,对同时多线程结构的取指策略和分支预测算法进行了深入的研究。作者的主要工作以及取得的研究成果如下: 1.通过对PowerPC750体系结构的研究,完成“龙腾R2”微处理器的定点流水线设计方案,指令集与PowerPC兼容。基于对微处理器速度、面积和性能综合考虑,采用包括取指、译码、取操作数、执行、异常检测和写回在内的6级流水结构。 2.对“龙腾R2”的异常进行分类,实现“龙腾R2”流水线的精确异常处理,在保证处理器时序的前提下,合理的解决了该流水线中的数据相关,控制相关以及资源相关。 3.完成“龙腾R2”处理器中包括分支处理单元和取指单元在内的流水线前端组织结构的详细设计。其中分支处理单元可支持静态和动态分支预测算法,同时该单元中利用分支目标地址缓冲区(BTIC)加快分支处理速度。取指策略主要采用适合于“龙腾R2”的多取指低频度方法。 4.针对超标量技术的局限性,为了进一步提高“龙腾R2”处理器的处理能力,提出了“龙腾R2”同时多线程处理器的流水线结构,并对该结构进行了仿真分析。仿真结果表明,“龙腾R2”SMT结构的IPC比“龙腾R2”超标量结构平均提高了30.86%。 5.分析同时多线程的研究热点,重点研究取指策略和分支预测算法,进而选取适合的取指策略和分支预测算法,构造“龙腾R2”SMT处理器的取指控制部件模型并进行仿真分析。新的取指策略能使指令队列中有效指令的比例上升21.4%,新的分支预测算法的预测精度也比原来提高了5.6%。
其他文献
信息集成可以最大程度的利用已有知识成果,屏蔽数据的半结构性、异构性和分布性,为用户提供统一的模式,实现异构数据源之间的信息交换及从异构数据源中有效获取信息。在信息
优质、清洁、环保的天然气对改善环境大有裨益,它在能源消费中的占比也将越来越大。天然气的需求和消费不断增加,与之相关的供给可靠性也越来越受到大家的重视,而燃气负荷的
随着网络规模的不断扩大以及网络技术的飞速发展,安全性也显得越来越重要。入侵检测在整个安全体系中特别是在动态安全防御体系中有很重要的地位。如今入侵检测技术正在扮演着
网格高度的动态性、自治性、异构性给网格环境下的实体合作提出了严格的要求。如何管理分配异构、分布的资源是网格发展要解决的核心问题之一,一种好的资源调度策略能够充分有
随着计算机技术及Internet的飞速发展,网络已经深入影响到了我们日常生活的每个方面。而各式各样的电子文本已经成为我们获得信息的最主要来源。其庞大繁杂的信息使高效、快捷
信息社会的今天,电脑应用系统已经渗透到各行各业。而国内绝大多数旅游景点在门票管理上仍采用人工售票、人工验票等人工管理模式,已远远不能适应现代旅游景点管理的需要。解决
车间作业调度问题是一类具有时间约束、次序约束和资源约束的组合优化问题。在理论上已经证明,车间作业调度问题是一个NP问题,而解决这一问题的关键在于性能良好的优化调度方
近年来DNA计算得到了飞速发展,它具有高度并行性,运算速度快,作为信息载体其贮存容量大,能量消耗低,资源丰富等优点。目前DNA计算在实现上受限于化学条件及自身特点,实现步骤复杂,错
随着实时系统在工业领域的广泛应用,工业实时系统不仅需要保证数据采集、控制、数据传输等周期任务在规定的时间内完成,也要保证突发事件触发的非周期任务的及时响应,而且要保证
Web应用程序的测试包括性能测试和结构化测试两类,分别用于测试Web应用程序的性能表现与内部实现。结构化测试比性能测试更能准确定位程序内部错误,故此,众多研究者针对结构