精度可变多路浮点运算单元设计与验证

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:baidawei888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
浮点运算具有动态范围大、运算精度高、开发效率高等优点,在信号处理、高性能计算等领域广泛使用。不同应用场景中对精度的需求往往大不相同,而目前浮点运算对不同精度的应用都采用固定的单精度或双精度格式,造成运算及存储资源的冗余和浪费。在性能和功耗的瓶颈日益突出的今天,研究具有精度可变、硬件复用的浮点运算单元,具有重要意义。本文以提高浮点运算吞吐率同时降低所需功耗和硬件资源为目的,在保证目标应用运算精度的前提下,减小浮点数冗余的小数位宽,将浮点运算多路并行,提高电路功耗效率。本文首先基于精度运算理论开发了浮点运算精度跟踪模型,评估目标应用在不同浮点数位宽下的运算精度。本文然后设计了精度可变多路浮点乘加单元(VP-FMA),支持1路24位、2路12位、4路6位三种浮点运算精度,工作模式根据目标应用所需的最大精度进行选择。该设计的创新之处在于,不同于基于FPGA类型的可配置电路设计,VP-FMA实现了不同精度浮点运算真正意义上的电路复用。通过增加少量的控制逻辑,使得1路24位单精度浮点运算的硬件电路,能够同时支持2路12位小数域位宽,以及4路6位小数域位宽的浮点运算。对于精度要求不同的目标应用,本文的设计能够多路浮点并行运算,有效地提高电路的功耗效率。本次设计使用VHDL语言完成精度可变多路浮点运算单元的实现,并进行了模块和系统级验证,最后使用TSMC 90nm CMOS工艺库进行了综合。在200MHz工作频率下电路面积为0.06mm2,功耗效率可以达到546.08MFLOPS/W,比传统设计大约提升了近3倍,而面积只增加了40%。结果表明本文设计的精度可变多路浮点运算单元明显地提高了电路功耗效率,在相同的功耗下比传统浮点运算单元有更高的运算性能。
其他文献
本文以沈阳市某供热公司3号锅炉的多管除尘脱硫一体化设备为研究对象,针对其除尘脱硫效率低的问题对其进行优化改造。基于影响设备除尘脱硫效率的主要因素以及工程的实际情况
由于英汉文化无论在地理环境、风俗习惯、社会历史、宗教信仰等方面都存在差异,因此具有各自民族特色的两种习语的互译就必然存在困难。归化与异化翻译法可以从不同的角度诠
随着超大规模集成电路技术的发展,芯片尺寸日益缩小,带动了光刻技术的进步。由于光刻技术的分辨率要求越来越高,193nm光阻(Photoresist:PR)成为248nm光阻的替代者。而由于两
应用型本科院校英语专业的翻译课程是培养复合型人才必不可少的主干课程,本文以功能翻译理论为指导,从课程定位与设置、教学内容与方法、师资培养与团队建设等方面,系统地探
YHFT-XX是一款国产的高性能多核数字信号处理(DSP)芯片,内核采用11发射超长指令字(VLIW)结构,单条指令40或80位。向量处理部件(PXX)是DSP内核中面积最大的一个模块,每个PXX内
光纤光栅具有灵活的滤波性能、易于光纤系统融合、插入损耗低、制作简单等特点,因而成为国内外研究的热点。相位取样光纤光栅是光纤光栅技术不断发展的产物,不但频谱上表现出
阐述气象科普政策法规的涵义和分类,从综合性科普政策法规、气象相关政策法规中的科普条款和专门气象科普政策法规三个层次研究和分析我国气象科普政策法规的现状,总结提出目前
目的:为美金刚用于阿尔茨海默病(AD)临床治疗提供参考。方法:通过检索medline,embase,Cochrane图书馆和FDA网站等网络资源,收集关金刚在人体应用的药效学、药动学、耐受性以及用于AD
2011年1月,重庆市渝中区检察院办理了一起特大系列股票诈骗案。2009年5月至2010年1月期间,以犯罪嫌疑人周成兵和窦强为首的犯罪团伙,虚构“神化私募网”、“东亚私募网”等公