高精度浮点反正余弦函数运算单元硬件设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:slrjlc2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着军事、雷达、卫星等应用需求的不断提升,关于高精度浮点超越函数的实现不断被提出。其中,反正余弦函数运算单元在数据分析、气象计算、信号处理等领域有着非常重要的应用,因此高性能浮点反正余弦函数运算单元的设计与实现对现代工程应用具有重大意义。目前,反正余弦函数运算单元的实现方法主要包含查找表、泰勒多项式逼近等方法,这些方法虽在低位宽运算中保证了一定的运算性能,但当位宽不断增加,其资源开销也随之急剧增加。本论文中采用的坐标旋转数字计算机算法(Coordinate Rotation Digital Computer,CORDIC)仅利用加法和移位运算完成函数计算,这极大的降低了运算的复杂度,为提高运算单元的性能提供了新思路。同时,芯片集成规模的不断增大为高精度浮点超越函数运算单元的全硬件化设计提供了基础。本文基于CORDIC迭代算法,完成了128位浮点反正余弦函数运算单元的硬件设计。本文改进了圆周坐标系向量模式下的CORDIC算法,设计了一种针对反正余弦函数运算的四步并行迭代算法。该算法基于传统的CORDIC算法,采用合并的策略,一个时钟周期内同时完成四次单步迭代,同时通过并行计算Xi,Yi,Zi的16种情况,对下次四步迭代旋转判决因子进行预测。随后,根据Y路径传出的方向判决因子,对16组并行计算中的正确输出结果进行选择,完成当次迭代。与传统CORDIC算法相比,在规定的输入范围内,改进后的四步并行CORDIC迭代算法仅需36个时钟周期就可以达到113位精度要求,这大大降低了计算延时,提高了运行效率。本文采用模块化设计思想,将反正余弦函数浮点运算单元硬件结构分为预处理模块、定点运算模块、浮点规则化三个模块。定点运算模块又可以分为四步并行旋转迭代模块、泰勒多项式逼近模块以及等价模块。预处理模块主要实现了输入浮点数的解码及异常值检测功能,即将输入的浮点数转化为CORDIC算法可计算的定点数值,并保证在算法收敛域内;定点运算模块将改进后的四步并行CORDIC迭代算法以及应用于小数值区间的泰勒多项式逼近法进行了硬件实现;而浮点规则化模块主要对定点运算模块的输出结果进行前导零检测、舍入处理,最后将定点反正余弦值转换为128位标准浮点输出。论文采用了Verilog语言对反正余弦函数进行RTL级建模,利用Modelsim平台对其仿真及验证,最后基于TSMC-65 nm工艺完成了设计的DC综合。在测试过程中,通过Python的bigfloat包输出大量的128位浮点随机数据,并利用Python生成的理想计算结果与本设计的仿真结果进行了数据对比。由测试结果可知,本设计在计算周期仅为36个时钟的情况下完成运算,且浮点反正余弦函数运算单元在全域[-1,1]的输入范围内,最大运算误差不超过1 bit,高质量的实现了精度要求。综合结果表明,整体设计的工作频率可达到500 MHz,反正余弦函数运算单元估计的硬件面积约为2.3471 mm~2。综上,本设计达到了预期目标,最终实现了高精度浮点反正余弦函数运算单元的硬件设计。
其他文献
近年来,物联网(Internet of Things,Io T)技术快速发展,在环境监测、智能家居、智慧城市等方面发挥着重要作用,但现有的物联网都是基于基站构建的,基站部署成本较高且抗毁性较差,因而地面物联网有许多的局限性,这些因素导致人们开始寻求其他类型的网络与物联网进行结合,于是卫星物联网的概念被提出。卫星物联网是将地面物联网和低轨卫星星座结合进行数据传输的网络,在这个网络中,大多数时候地面用
空间物联网(Space Internet of Things,S-IoT)是在卫星物联网和地面物联网研究基础上发展并响应我国对于天地一体化信息网络建设的重大信息基础设施。加速发展S-IoT,建设空、天、地、海一体化网络是未来移动通信的必然发展趋势。S-IoT具备广域覆盖特点,能够突破传统地面物联网的局部碎片化网络特征,提供全球无缝覆盖、“随遇接入、按需服务”的接入能力。但是,目前大规模IoT设备的
高动态范围(High Dynamic Range,HDR)图像相对低动态范围(Low Dynamic Range,LDR)图像可以呈现出更丰富的色彩和更多的亮度级别,能够达到计算机图形学及相关行业的要求,满足人们对高质量视觉体验的需求。传统的HDR图像通过合成同一场景多幅不同曝光的LDR图像得到,但是现存的LDR视觉媒体绝大部分只有单曝光版本,因而将包含信息有限的单张LDR转化为具备更多细节信息的
随着移动互联网的迅猛发展,聚焦于超高速、高可靠、低时延等特性的第五代移动通信技术(5G)成为了国内外无线通信领域的研究热点。信道编码技术作为无线通信不可或缺的重要信息传输手段,其性能直接关系到网络覆盖率和用户传输速率的提高。2016年国际移动通信标准化组织3GPP确定Polar码成为5G增强移动宽带(Enhanced Mobile Broadband,e MBB)场景下控制信道的短码标准。作为一个
被动锁模光纤激光器实际上是一个耗散系统,适用于观察各种孤子动力学和非线性现象,并且具有体积小、抗干扰性好、功率高等优势,因此近年来受到广泛的研究。目前主要使用非线性偏振旋转效应(NPR)、八字腔和二维材料锁模、多模光纤混合结构等方式来锁模并实现多孤子输出。本文围绕基于非线性多模干涉效应的被动锁模掺铒、掺镱光纤激光器和NPR效应的锁模掺铒光纤激光器展开了多孤子锁模的研究。本文首先使用三种不同的多模光
图像是人类获取信息的重要载体,科学技术的进步和人类的发展离不开图像的获取。但是图像获取过程并不是理想化的,多种因素的存在使得图像在获取过程中发生退化,对于通过退化后的模糊图像来获得清晰图像这一需求,人们提出了一系列图像复原算法。相比空间域,图像在变换域中能够表现出更多的特性,基于该理论本文的研究从传统的图像复原算法和神经网络图像复原两个角度展开,分别引入小波变换,对算法进行研究以达到更好的图像复原
人口老龄化成为日益严重的社会现象,随之而来的健康问题也越来越受到人们的重视,其中,听力损失问题广泛存在于老年群体中,严重影响患者与外界的沟通能力和生活质量,助听器作为听力损失治疗的首选方案应运而生。助听器的关键技术众多,更符合人耳的听觉感知特性以及更舒适的佩戴体验始终是设计助听器的首要考虑因素。本文从人类听觉感知机理和听力障碍的产生机制开始研究,并基于听力损失患者的听力曲线,提出宽动态压缩算法的设
硅基光电集成被认为是高带宽和低功率光互连的理想解决方案,高性能电光调制器和探测器作为互连系统的核心器件,起着转换光电信号的作用,其性能优劣很大程度上决定了系统的整体性能。迄今为止,在通信波段对于互连系统无论分立器件还是系统集成均已实现一定程度的商用化,但是为满足日益增长的容量需求。亟需开展2μm波段光互连的研究以进一步拓展通信容量。本文以硅基光互连分立器件的开发以及2μm光通信新窗口的探索为背景,
近年来,高集成度、低功耗、低损耗的光电器件成为硅基光子学的研究重点。绝缘体上硅(Silicon-On-Insulator,SOI)平台上的光开关具有尺寸小、低功耗的优点,最重要的是基于硅材料的光开关可与互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)制造工艺兼容。波导型光开关具有集成度高,尺寸小的特点,是光子集成电路中的重要组成器件之
钙钛矿是一种新型半导体材料,具备载流子扩散距离长、带隙可控、载流子寿命长等优点。近年来钙钛矿不仅于太阳能电池的研究中扮演重要角色,也被广泛应用于微型激光器、光电探测器的研究中,具有很好的应用前景。然而目前关于将各类钙钛矿光电器件进行集成的相关研究却很少,其中一个重要原因在于材料制备方面的瓶颈。尽管理论上钙钛矿单晶相较于多晶薄膜具有更好的光电性能,目前大多数基于钙钛矿的器件依然依赖于多晶薄膜,现实与