UniCore-3处理器浮点执行部件设计与验证

来源 :北京大学 | 被引量 : 0次 | 上传用户:yaocjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代高性能处理器普遍采用超标量结构,通常使用独立的处理部件对浮点数据进行处理。在浮点处理部件设计和验证过程中,需兼顾时钟频率、面积等设计目标,同时权衡设计复杂度与开发时间的关系。其中,复杂算术运算的选择和实现、运算过程中的精度控制以及IEEE-754标准兼容性测试是浮点设计的重点和难点。  本文面向北京大学微处理器研究开发中心研发的64位超标量多核处理器UniCore-3,完成了浮点执行部件(FPU,Floating-point Unit)的设计与实现,对设计的功能正确性进行了验证;检测了FPU的IEEE-754标准兼容性;对UniCore-3浮点运算性能进行了评测。本文的主要工作包括:  1.对五种浮点指令系统、五款主流微处理器浮点执行部件的结构、算法选择、运算性能进行对比分析。针对UniCore-3处理器的设计目标和UniCore-F64浮点指令系统的特征,确定出需支持的浮点运算种类及FPU的整体结构,选择适用算法形成完整设计方案,并完成代码实现。通过时序分析对关键路径进行了设计优化,达到UniCore-3处理器1.0GHz的频率目标。  2.根据UniCore-3处理器FPU设计规范,制定功能覆盖大纲和详细验证文档,完成了FPU模块级和汇编级功能验证。采用testfloat和sofffloat工具搭建IEEE-754兼容性测试环境并完成测试。测试结果表明:除个别运算和非规格化数精度控制需和软件共同支持外,兼容IEEE-754标准其他所有特性。  3.使用Whetstone和SPEC CFP2000基准测试程序,在UniCore-3处理器FPGA原型验证系统中对浮点运算性能进行了评测。评测结果表明,相对于上一代处理器,UniCore-3处理器的浮点运算性能提升28%。通过对UniCore-3各级流水线阻塞情况的数据分析,保留站数量和复杂运算单元如除法的执行速度是目前影响浮点运算性能的主要因素。
其他文献
随着超大规模集成电路(VeryLargeScaleIntegratedcircuit,VLSI)工艺的发展,对VLSI设计工具提出了更高的要求。布局是VLSI物理设计的一个重要步骤。在当前的工艺环境下,布局工具
随着互联网的不断发展,诸如微博、社会网络等社交网站正处于高速发展的阶段,越来越多的数据被用户发布到图结构的网络中,伴随而来的是对于社会网络图、知识图谱等图数据的分析和
"地震反演数据管理软件"研究是主要内容是,以面向对象技术作为指导,针对国内油田的特点研究和建立一套适合国内油田的油气勘探数据模型,其中包括地质数据模型,地震数据模型和
该文主旨在于利用矢量数据和栅格数据的现有的基本原理与方法,把两者有机的结合起来,利用比较成熟的关系数据库管理数据的方法管理空间数据,并对空间数据库的设计、空间数据
该论文在优选挖掘方法的基础上,运用数据挖掘技术对成绩管理数据库进行挖掘.对待挖掘数据进行预处理,构建了待挖掘数据库—成绩管理数据库,建立了综合素质评价的指标体系和模
SIP代理服务器主要负责对呼叫的路由功能,即对SIP消息的检查、翻译和转发,以及对SIPUA的认证和计费数据的生成.SIP代理服务器与其他SIP服务器协同工作,从而完成IP话音的交互.
该文依托于863缩小数字鸿沟—西部行动公共信息平台项目"基于国产Linux农牧林业科技综合信息服务系统平台共性技术的研究",讨论基于Web资源管理系统的设计和实现.通过基于Web
如何针对敏捷供应链的动态异构的特点,根据实际情况,构建敏捷供应链管理系统,实现供应链内的信息共享和交互,是一个亟待解决的热点问题.Web服务是Internet发展到一定阶段的产
该课题的来源,摩托罗拉公司的无线下载系统正是具有这样的需求:分布式,要求具备良好的可扩展性和安全性.因此,我们引入基于构件的软件开发技术并将其应用于该课题.该文首先阐
该文主要讨论如何提高数据挖掘技术中关联规则挖掘算法的执行效率即算法执行有效性的问题.重点对关联规则挖掘算法中目前常见的AIS算法、SETM算法、Apriori算法和AprioriTid