论文部分内容阅读
在3GPP-LTE基带信号处理中,基带算法采用求逆、转置、共轭等矩阵运算实现对信号的处理。这些运算在LTE基带ASIP(Application Specific Instruction Processor)中被映射成向量运算,来满足高速处理基带算法的需求。然而随着LTE通信标准的演进,单位时间内处理的数据量及基带算法的复杂性不断提高,使ASIP向量部分的设计复杂度及计算功耗不断增加。目前,ASIP的向量部分功耗已占ASIP总体功耗的30%以上,向量部分的功耗问题成为LTE基带ASIP设计中一个重大挑战。 为了解决向量部分功耗的问题,面向LTE基带信号处理的ASIP低功耗设计还需从以下四个方面展开研究:(1)从功耗相关特性分析角度,进行ASIP相关设计参数的快速评估、系统级仿真和与功耗相关结构参数的评估;(2)从向量数据通路角度,需要设计一种低功耗的ASIP数据通路结构及其内部功耗控制方式;(3)从向量寄存器堆角度,需要设计适合向量数据访问的低功耗向量寄存器堆结构;(4)从向量运算部件角度,需要针对不同向量运算模式进行低功耗设计。 本文针对ASIP向量部分的低功耗设计展开研究,取得的主要创新性研究成果如下: 1.针对功耗相关特性分析的问题,设计了无线软基带SOC仿真平台,该平台提供处理器核的快速设计及仿真支持,并提供处理器功耗相关特性的评估。该平台的创新之处在于:提供基于SystemC的ASIP快速建模支持;提供指令集、常见功能单元的XML描述及辅助模块代码自动生成;提供链路及系统级ASIP设计仿真支持。通过这个仿真平台,可以在设计前期对LTE数据链路进行快速搭建、算法映射及仿真,快速完成基带芯片的前期设计评估及后期对处理器结构参数进行评估。 2.针对向量数据通路的功耗问题,提出了一种异构VLIW数据通路结构及其低功耗控制方法,有效的降低了向量数据通路的功耗。在具体实现方面,通过对典型的ASIP数据通路结构的对比得出异构VLIW结构具有较高的能效比,并基于通路间耦合度最小原则设计了低功耗异构VLIW结构。在此基础上,设计了异构VLIW数据通路功耗控制单元。该单元采用编译器指示方式动态触发处理器进行不同功耗模式的切换,减少空闲数据通路的动态功耗开销。实验结果表明,采用异构VLIW结构的数据通路的功耗控制方法可降低平均18%的功耗开销。 3.针对向量寄存器堆的功耗问题,提出了一种基于缓存辅助的向量寄存器堆,有效的解决了原有集中式向量寄存器堆的访问功耗高的问题。在具体实现方面,通过对LTE基带算法中向量寄存器堆访问特性的评估,发现算法程序中对向量寄存器堆端口的访问大部分情况下未达到最大端口数,且算法程序中存在许多短生命周期量,没有必要写回向量寄存器堆。基于这些特点,在结构上增加了一个向量寄存器堆缓冲,用于缓冲由于读写端口减少后发生访问冲突时的临时变量、以及暂存一部分超过流水线旁路寄存深度的短生命周期量。这种新的向量寄存器堆可以有效减少寄存簇间的拷贝及移动操作,优化向量寄存器堆读写端口共享,减少短生命周期量写回向量寄存器堆的操作。实验结果表明改进后的向量寄存器堆比集中式向量寄存器堆降低平均6.1%的功耗开销。 4.针对向量运算部件的功耗问题,提出了衔接操作指令优化方法以及基于存储的向量运算模式优化方法,减少了向量运算部分的功耗及算法程序运行能耗开销。在进行向量运算的低功耗设计过程中,我们对向量运算数据流操作模式进行了分析,把向量运算模式划分为:基于向量寄存器的运算模式、基于存储的运算模式。(1)在基于向量寄存器的运算模式中,大部分向量运算前需要进行向量数据位置换或者对齐等操作。这部分操作虽然计算量较小,但每次均需要消耗与计算单元相同的时钟周期,并产生中间结果保存到寄存器堆中。基于此发现,我们提出了衔接操作指令优化方法,把向量运算单元及置换/移位单元操作合并在同一级执行单元中,减少了把中间结果写入向量寄存器堆的操作。实验表明衔接操作指令优化方法降低平均8%的功耗开销。(2)对基于存储的向量运算模式进行分析,发现该模式具有循环体、循环次数固定且每次运算后均有地址改变的特点,对该模式进行了循环优化及地址操作指令优化。实验结构表明,优化后可减少了约11.6%算法程序运行能耗。 最后,我们进行了综合实验验证,主要包括:(1)各种低功耗方法的低功耗效果的比较;(2)各种低功耗综合应用后与上一代处理器性能及功耗的对比;(3)处理器通信性能的仿真结果;(4)与相关的通信处理器平均功耗、面积、性能等对比分析。实验结果表明,改进后的处理器相比上一代处理器有26%的功耗降低效果,并达到了LTE CAT4的要求。