高性能浮点除法及基本函数功能部件的研究

来源 :中国科学院研究生院(计算技术研究所) | 被引量 : 29次 | 上传用户:my_wenzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着VLSI技术的发展,针对各个方面应用的处理器相继提出,特别是DSP,MMP等专用处理器。这些处理器对性能的要求使得除法和基本函数功能部件作为其中独立的运算部件成为可能。同时,除法和基本函数功能部件的性能也是影响这些处理器整体性能的一个重要方面。各种应用的处理器对计算速度,芯片面积以及功耗大小有不同的要求,这对除法和基本函数功能部件的设计提出了相应的要求。实现除法和基本函数功能部件的常用算法有两类,其中一类是数字循环方法,另一类是函数叠代方法。数字循环方法是使用基于减法的循环算法每次产生一个商数字;函数叠代方法是使用基于乘法方法的循环算法逼近精确结果。对于数字循环算法来说,实现该算法需要的时间延迟可以决定整个处理器的频率;实现该算法的计算周期可以影响整个处理器的性能。所以,在算法需要的计算周期不变的情况下,减小时间延迟;或者在时间延迟增加很小的情况下(增大后的时间延迟在处理器整体设计对时间延迟约束的范围内),减小算法需要的计算周期,对整个处理器的性能影响比较大。针对以前SRT算法的实现方法和结构,本文提出两种改进结构:一种结构可以减少SRT关键路径上的时间延迟;另一种结构在增加很少时间延迟的情况下,能够减少SRT-4算法(该算法是处理器中使用比较多的SRT算法)的循环次数。对于函数叠代算法(包括Newtow-Raphson和Goldschmid算法)来说,决定该算法性能的主要方面之一就是初始值的位数。如果初始值的位数越长,需要的循环次数就越少,实现该算法需要的计算周期也越少;如果初始值的位数越短,需要的循环次数就越多,实现该算法需要的计算周期也越多。得到初始值的方法很多,主要包括两种,一种是适合于得到较短位数初始值的基于多表相加逼近方法,另外一种是适合于得到较长位数初始值的多项式逼近方法。本文给出这两种不同类型的改进方法。对于基于多表相加逼近方法来说,本文给出的优化方法可以减小查找表需要的位数;对于多项式逼近方法来说,本文给出的新型方法可以减小需要的面积和时间延迟。对于这些方法,本文给出了详细的数学分析和严格的实验证明。最后,本文对采用不同参数设计的处理器中常用的浮点除法部件,其中包括基为4,8,16的SRT算法和初始值位数长度分别为13,16,24位的Newton-Raphson算法,在速度,面积和功耗上进行了详细的比较,并给出了相应的结论。
其他文献
通过对16例健康老年男性练功者血清睾酮(T)、雌二醇(E2)及促黄体生成素(LH)的放射免疫测定和自身对照研究,发现练功6个月后,同自身练功前比较,血清T水平无显著变化,但血清E2及LH水平显
视频监控系统面临着一系列安全问题,频频出现视频监控假冒、窃取和非法控制事件。基于可信计算技术,设计了可信视频监控系统安全架构。该架构对系统中的计算设备实施可信安全
目的:探讨内镜下诊治大肠息肉的方法和疗效。方法:对185例大肠息肉病例经电子结肠镜下高频电刀切除等治疗并进行分析总结,随访者复查肠镜后评价疗效。结果:全部病例均治愈,未发生
高性能计算机是现代科学研究、工程技术开发和大规模数据处理的关键支撑技术。随着高性能计算机的发展,并行计算机的体系结构越来越复杂,并行程序设计的难度也越来越大。使用
磁记录,特别是硬盘磁记录,以其经济性和可靠性,成为现代信息存储的最重要手段。从硬盘诞生之日起,其记录密度一直保持良好的增长势头。新的磁头技术和介质技术的不断开发和运
随着油田开发的不断深入,油田增产措施产生包括油水井作业废液和压裂返排液、注水井及干线冲洗等废液对环境的影响越发受到重视,为了满足油田开发对水质的要求,从环境保护和
基本建设项目竣工财务决算报告是基建项目的总结性报告,是确认基本建设项目投资支出、正确核定新增资产价值、反映水利基本建设成果的重要文件,是办理水利工程资产移交和投资
目的:探讨指导规范自我监测血糖对初发2型糖尿病患者非胰岛素治疗后的血糖控制情况。方法:132例新诊断、采用非胰岛素治疗的2型糖尿病患者,随机分为规范自我血糖监测组和非规范
采用浸渍法制备负载铁锰氧化物的活性炭催化剂,并用其催化臭氧氧化处理邻苯二甲酸二甲酯(DMP)废水。利用响应面法(RSM)对催化臭氧氧化处理的工艺参数进行优化,以DMP废水的COD去除率
如今,全世界每天都在爆炸性的产生各种新的信息量。对于存储系统的容量需求,也从PB(Petabyte)、EB(Exabyte)到如今能容纳‘’Big Data"的海量存储系统在发展。尽管有各种新的