论文部分内容阅读
信息技术的发展带动着数据业务的爆炸式增长,人类开始逐渐步入大数据时代,一个典型的例子是无线通信数据业务始终保持着几何数量级的增长。另外,人们对无线通信的要求已经不仅仅满足于互联,而是追求更好的用户体验和更高速率的数据服务。无线通信系统需要在有限的频谱资源下支持更高速的数据处理,更好的用户体验和更多的用户接入,因此无线通信的算法也将更加复杂。但是,随着后摩尔定律时代的逼近,半导体尺寸开始接近极限值。摩尔定律驱动设备更新的作用开始逐渐降低,无线通信终端硅片面临着高复杂度和高功耗的挑战。在现有的工艺条件下,优化无线通信系统中复杂度较高的计算密集型算法的VLSI结构将是降低无线通信硅片面积和功耗的有效手段。 本文对MIMO-OFDM无线通信系统中计算复杂度较高的相关算法,如FFT处理器,MIMO检测器和信道译码器,进行了VLSI结构研究,以期达到更高的数据传输率,更优的复杂度,和更低的计算功耗。本文的主要创新点包括: 1.对OFDM系统中可变长度的FFT处理,设计了一种带有效无冲突地址分配规律,可以处理多种数据长度的存储器型的FFT处理器。通过这种地址分配规律,任意长度的FFT计算可以在一个处理单元中进行处理,包括单一幂的FFT点数,非单一幂的FFT点数,和任意的素因子组成的FFT点数。尽管以上三种的FFT点数的分解算法不一致,但是其可以通过所提的地址规律进行统一。另外,FFT处理器采用了一种大基底的分解方式减少计算时间,而采用多级小基底蝶形单元互联的方式降低整个核心计算引擎的复杂度。另外,针对不同蝶形单元的计算长度,设计了一种统一的蝶形单元结构,可以将不同基底,如基-2,基-3,基-4,基-5等蝶形单元统一在一个运算模块当中。对LTE系统中的两种不同长度的FFT处理单元,采用所提的方法分别设计了一个实例。结果表明,本方法和其他类似的存储器型FFT处理器相比具有更通用的计算长度和更加灵活的处理速率。 2.针对MIMO系统中多路FFT并行计算的特点,设计了一种流水线型的多路并行处理的FFT处理器。比较了两种经典的流水线型FFT处理器结构,MDF结构和MDC结构在存储器消耗,计算资源和处理过程控制等方面的差异,得到结论:MDF结构比MDC结构对于多路数据流并行处理更有效。为了降低MDF结构的硬件资源,通过一种二叉树模型对FFT的分解算法进行了分析,使得整体乘法的计算资源最小化。另外,对于多路并行流水线 FFT处理器的倒序输出,设计了一种新的电路结构,使得其可以有效处理多个并行度输出的数据。针对LTE系统中的多路数据的FFT处理设计了一个实例。 3.设计了一种4×4的排序的MMSE扩展的QR分解模块。和将矩阵先扩展到实数域再进行分解不同,本文直接在复数域下对矩阵进行分解,比在实数域进行分解要节省近50%的计算复杂度和计算延迟。采用并行的Givens旋转的方式降低计算复杂度和延迟。在完成复数域的分解之后,将分解结果扩展成一种实数模型提供给后续的检测模块进行处理,而不需要其他的计算过程。在进行排序和列更新的过程中,采用了l1的模值计算方式和一种提前列更新的方法,进一步降低了复杂度,节省了延迟。 4.设计了一种4×464-QAM的复数域软输出的K-Best检测器。采用了一种非固定参数的K-Best检测器,在上层搜索树中保留更多幸存路径和废弃节点,在下层搜索树中减少计算的节点个数。通过这种方式在保证系统性能的同时,将系统的复杂度降低了约50%。另外,讨论了Bit-Flipping方法对于增加候选路径列表以改善LLR质量的作用。在复数域中对K-Best检测器的节点扩展和访问的方式进行了研究,通过一种双层节点的扩展和比较的方式,找出每一层近似最优的节点,减少了系统的计算延迟,增加了系统吞吐率。另外,设计了一种分层流水线的处理结构,对每一层的节点扩展和比较采用并行展开的方式使得吞吐率最高可以达到1.92 Gbps。 5.设计了一种高吞吐率的Viterbi译码器,其采用一种双向的滑动加窗的译码算法,突破了传统Viterbi译码器的速度瓶颈。其吞吐率可以通过增加数据块的并行度进行提升。另外,对于传统译码器中的加比选单元进行了优化,能将速率提升26%,但是面积和功耗却和普通的加比选单元相近。