高能效混合浮点FFT硬件加速器架构与VLSI实现研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:tiantian200510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速傅里叶变换(FFT)是数字信号处理中最常用的算法之一。它始终是数字信号处理领域的研究热点。如今,FFT是很多新兴应用中的关键处理模块,如基于正交频分复用(OFDM)的手持移动通信系统和生物医疗电子信号处理平台。这些应用有一个显著的共同点,那就是它们要求整个系统的功耗极低,以延长产品的使用周期。同时,它们也要求系统具备良好的适应性,在面对不同信号输入时,都能给出理想的处理结果。因此,FFT硬件加速器必需在保证一定量化信噪比(SQNR)输出的前提下做到高能效、低成本和高灵活性的实现。针对上述要求,本文从算法和电路层面优化设计实现FFT硬件加速器。在算法方面,本文总结了FFT硬件实现中常用的数据表示格式,包括定点格式、浮点格式和基于定点缩放的方法。在这些格式的基础上,本文提出了动态偏置调节的混合浮点方法。该方法采用浮点格式的指数域和定点格式的小数域,并使复数的实部和虚部共享一个指数域。这样可以在保证数据精度的前提下,减少硬件实现的成本和功耗。此外,动态偏置调节的方法可以根据输入信号的不同在运算过程中动态调整数据表示范围,从而提高整体SQNR。这种机制保证了FFT硬件加速器的灵活性和高精度输出。因此,采用动态偏置调节的混合浮点方法的FFT硬件加速器能够以较小数据位宽获得较高SQNR,从而达到降低功耗和成本的目标。在电路层面,本文实现的FFT硬件加速器采用单存储器架构以降低硬件的开销。在数据通路的实现中,本文采用多种方法来降低功耗和提高SQNR。第一,本文分析并减少蝶形运算中所需的浮点归一化操作,由原来的15个操作降低到4个操作。第二,本文分析并缩短蝶形运算中所需的数据处理位宽,在小数位宽为9时,可以使中间处理位宽节省多达6比特。第三,本文采用Trounding的数据舍去策略,尽可能地降低量化误差而不增加过多的硬件开销。此外,本文最后着眼于基于低电压存储器的FFT硬件加速器设计。首先概述存储器故障的种类和产生原因。然后描述了一定电压下存储器故障率的分析仿真方法。之后,给出具体故障率与电压和电路频率之间的关系。并根据这个对应关系分析出一定存储器电压下FFT硬件加速器的SQNR以及该情况下的功耗收益。本文提出的FFT硬件加速器能够计算64-8192点的变换。当数据位宽为3+2*9比特,存储器电压为0.7V,使用SMIC 65nm工艺时,FFT硬件加速器工作在400MHz,面积为0.482mm2,功耗为35.3mW。64点和8192点对应的SQNR分别为41.6 dB和35.8 dB。
其他文献
学校教育是国家培养人才、化民成俗的重要手段,是文化传统得以传承发展的重要载体。我国古代的中央官学是全国最高的学校,集中体现着国家的教育政策、法令和法规,是国家教育发展
近年来,源于德国的一项新环境管理会计技术——物质流成本会计在日本得到了深入地实践和发展。依据多年的企业实践与理论研究,日本产业技术环境局、环境政策课和环境协调产业
本论文共分两大部分 第一部分: 综述了治疗充血性心力衰竭的药物——米力农的药理、临床研究进展,对米力农合成工艺路线及米力农粗品的纯化方法进行了研究和改进,以4-甲吡
目的观察综合康复训练对重型颅脑损伤及脑卒中行气管切开术后患者肺部感染发生率的影响。方法将符合入选标准的46例气管切开患者随机分为观察组和对照组,对照组给予各项常规
本文介绍了利用真空测试程序,对3M8XL环氧乙烷灭菌器真空泄漏故障进行快速有效的分析处理。
由于有机电致发光二极管(OLED)具有主动发光、宽视角、高效率,高响应灵敏度、可制作大尺寸与柔性面板等诸多优点,使其已成为当前光电器件领域一大研究热点。近年来,虽然基于
一些大型铸件,如大中型柴油机机体等的某些部位如果出现裂纹,虽然不影响使用,但如果不及时修复,随着时间推移,由于振动等原因裂纹会逐渐扩大直至损坏,影响机器的正常使用。波浪键扣
如今电力电子技术应用日益广泛,同时也带来了严重的谐波污染,对电网的安全运行造成了严重的危害。有源电力滤波器(APF)已经被用来缓解电网的谐波污染。在高压大功率应用场合,
随着SoC和IP核技术的推广,逻辑验证已成为芯片设计领域的一个主要难题。许多案例中,芯片的逻辑验证团队规模甚至超过逻辑设计团队。软件仿真技术作为目前最常见的逻辑验证方
智能汽车的开发使用对现有汽车责任强制保险提出了重大挑战。为了应对这一挑战,人们构想了若干保险方案。目前,为了促进智能汽车技术的发展,也为了保护交通事故受害人的利益,