论文部分内容阅读
快速傅里叶变换(FFT)是数字信号处理中最常用的算法之一。它始终是数字信号处理领域的研究热点。如今,FFT是很多新兴应用中的关键处理模块,如基于正交频分复用(OFDM)的手持移动通信系统和生物医疗电子信号处理平台。这些应用有一个显著的共同点,那就是它们要求整个系统的功耗极低,以延长产品的使用周期。同时,它们也要求系统具备良好的适应性,在面对不同信号输入时,都能给出理想的处理结果。因此,FFT硬件加速器必需在保证一定量化信噪比(SQNR)输出的前提下做到高能效、低成本和高灵活性的实现。针对上述要求,本文从算法和电路层面优化设计实现FFT硬件加速器。在算法方面,本文总结了FFT硬件实现中常用的数据表示格式,包括定点格式、浮点格式和基于定点缩放的方法。在这些格式的基础上,本文提出了动态偏置调节的混合浮点方法。该方法采用浮点格式的指数域和定点格式的小数域,并使复数的实部和虚部共享一个指数域。这样可以在保证数据精度的前提下,减少硬件实现的成本和功耗。此外,动态偏置调节的方法可以根据输入信号的不同在运算过程中动态调整数据表示范围,从而提高整体SQNR。这种机制保证了FFT硬件加速器的灵活性和高精度输出。因此,采用动态偏置调节的混合浮点方法的FFT硬件加速器能够以较小数据位宽获得较高SQNR,从而达到降低功耗和成本的目标。在电路层面,本文实现的FFT硬件加速器采用单存储器架构以降低硬件的开销。在数据通路的实现中,本文采用多种方法来降低功耗和提高SQNR。第一,本文分析并减少蝶形运算中所需的浮点归一化操作,由原来的15个操作降低到4个操作。第二,本文分析并缩短蝶形运算中所需的数据处理位宽,在小数位宽为9时,可以使中间处理位宽节省多达6比特。第三,本文采用Trounding的数据舍去策略,尽可能地降低量化误差而不增加过多的硬件开销。此外,本文最后着眼于基于低电压存储器的FFT硬件加速器设计。首先概述存储器故障的种类和产生原因。然后描述了一定电压下存储器故障率的分析仿真方法。之后,给出具体故障率与电压和电路频率之间的关系。并根据这个对应关系分析出一定存储器电压下FFT硬件加速器的SQNR以及该情况下的功耗收益。本文提出的FFT硬件加速器能够计算64-8192点的变换。当数据位宽为3+2*9比特,存储器电压为0.7V,使用SMIC 65nm工艺时,FFT硬件加速器工作在400MHz,面积为0.482mm2,功耗为35.3mW。64点和8192点对应的SQNR分别为41.6 dB和35.8 dB。