面向LTE基带信号处理的ASIP低功耗设计方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:klyh2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在3GPP-LTE基带信号处理中,基带算法采用求逆、转置、共轭等矩阵运算实现对信号的处理。这些运算在LTE基带ASIP(Application Specific Instruction Processor)中被映射成向量运算,来满足高速处理基带算法的需求。然而随着LTE通信标准的演进,单位时间内处理的数据量及基带算法的复杂性不断提高,使ASIP向量部分的设计复杂度及计算功耗不断增加。目前,ASIP的向量部分功耗已占ASIP总体功耗的30%以上,向量部分的功耗问题成为LTE基带ASIP设计中一个重大挑战。  为了解决向量部分功耗的问题,面向LTE基带信号处理的ASIP低功耗设计还需从以下四个方面展开研究:(1)从功耗相关特性分析角度,进行ASIP相关设计参数的快速评估、系统级仿真和与功耗相关结构参数的评估;(2)从向量数据通路角度,需要设计一种低功耗的ASIP数据通路结构及其内部功耗控制方式;(3)从向量寄存器堆角度,需要设计适合向量数据访问的低功耗向量寄存器堆结构;(4)从向量运算部件角度,需要针对不同向量运算模式进行低功耗设计。  本文针对ASIP向量部分的低功耗设计展开研究,取得的主要创新性研究成果如下:  1.针对功耗相关特性分析的问题,设计了无线软基带SOC仿真平台,该平台提供处理器核的快速设计及仿真支持,并提供处理器功耗相关特性的评估。该平台的创新之处在于:提供基于SystemC的ASIP快速建模支持;提供指令集、常见功能单元的XML描述及辅助模块代码自动生成;提供链路及系统级ASIP设计仿真支持。通过这个仿真平台,可以在设计前期对LTE数据链路进行快速搭建、算法映射及仿真,快速完成基带芯片的前期设计评估及后期对处理器结构参数进行评估。  2.针对向量数据通路的功耗问题,提出了一种异构VLIW数据通路结构及其低功耗控制方法,有效的降低了向量数据通路的功耗。在具体实现方面,通过对典型的ASIP数据通路结构的对比得出异构VLIW结构具有较高的能效比,并基于通路间耦合度最小原则设计了低功耗异构VLIW结构。在此基础上,设计了异构VLIW数据通路功耗控制单元。该单元采用编译器指示方式动态触发处理器进行不同功耗模式的切换,减少空闲数据通路的动态功耗开销。实验结果表明,采用异构VLIW结构的数据通路的功耗控制方法可降低平均18%的功耗开销。  3.针对向量寄存器堆的功耗问题,提出了一种基于缓存辅助的向量寄存器堆,有效的解决了原有集中式向量寄存器堆的访问功耗高的问题。在具体实现方面,通过对LTE基带算法中向量寄存器堆访问特性的评估,发现算法程序中对向量寄存器堆端口的访问大部分情况下未达到最大端口数,且算法程序中存在许多短生命周期量,没有必要写回向量寄存器堆。基于这些特点,在结构上增加了一个向量寄存器堆缓冲,用于缓冲由于读写端口减少后发生访问冲突时的临时变量、以及暂存一部分超过流水线旁路寄存深度的短生命周期量。这种新的向量寄存器堆可以有效减少寄存簇间的拷贝及移动操作,优化向量寄存器堆读写端口共享,减少短生命周期量写回向量寄存器堆的操作。实验结果表明改进后的向量寄存器堆比集中式向量寄存器堆降低平均6.1%的功耗开销。  4.针对向量运算部件的功耗问题,提出了衔接操作指令优化方法以及基于存储的向量运算模式优化方法,减少了向量运算部分的功耗及算法程序运行能耗开销。在进行向量运算的低功耗设计过程中,我们对向量运算数据流操作模式进行了分析,把向量运算模式划分为:基于向量寄存器的运算模式、基于存储的运算模式。(1)在基于向量寄存器的运算模式中,大部分向量运算前需要进行向量数据位置换或者对齐等操作。这部分操作虽然计算量较小,但每次均需要消耗与计算单元相同的时钟周期,并产生中间结果保存到寄存器堆中。基于此发现,我们提出了衔接操作指令优化方法,把向量运算单元及置换/移位单元操作合并在同一级执行单元中,减少了把中间结果写入向量寄存器堆的操作。实验表明衔接操作指令优化方法降低平均8%的功耗开销。(2)对基于存储的向量运算模式进行分析,发现该模式具有循环体、循环次数固定且每次运算后均有地址改变的特点,对该模式进行了循环优化及地址操作指令优化。实验结构表明,优化后可减少了约11.6%算法程序运行能耗。  最后,我们进行了综合实验验证,主要包括:(1)各种低功耗方法的低功耗效果的比较;(2)各种低功耗综合应用后与上一代处理器性能及功耗的对比;(3)处理器通信性能的仿真结果;(4)与相关的通信处理器平均功耗、面积、性能等对比分析。实验结果表明,改进后的处理器相比上一代处理器有26%的功耗降低效果,并达到了LTE CAT4的要求。
其他文献
随着集成电路工艺水平不断发展导致芯片特征尺寸持续降低,在现代高性能SOC(System On Chip)中,系统向高集成度、低供电电压的趋势发展,电源完整性问题甚至已经超越信号完整性问
在一些技巧性的体育比赛中,裁判的评定往往具有很强的主观性,从而给体育比赛带来了很多不公平性。利用计算机自动对比赛评定或者辅助裁判员评定将有效地减少比赛中的不公甲性。
嵌入式系统开发是当今计算机应用发展的一个热点。随着嵌入式硬件技术的不断发展,在嵌入式应用的不断增长以及系统复杂性不断提高的情况下,必然对嵌入式软件的规模和复杂性的要
随着SoC芯片越来越复杂,芯片的验证工作也越来越困难。传统的硬件验证方法在芯片设计完成后才开始软件验证,会降低验证效率,延缓芯片的上市时间。本文介绍的系统验证技术属于软
近年来,随着网络拓扑的日益复杂,多个自治域系统之间通信的要求越来越高,需要配置的策略越来越复杂。BGP协议是自治系统间路由协议的事实标准,对维护自治系统间选路连通性有重要
劳动力市场信息系统(又称“劳动99”系统)是在我国加快劳动力市场信息化建设过程中应运而生的,并在各地区劳动力资源的管理和调配中起到了重要作用。目前,同一个城市劳动力市场
随着半导体技术的发展,多核多线程体系结构已经成为未来计算机体系结构的发展方向。然而,相应的编程模型,编译器和运行时系统的研究则相对滞后。如何为用户提供一个简单易用的编
随着科学技术的飞速发展,人们之间的交流越来越丰富。为了增进人们之间的通信交互,多种社交媒体应运而生,如国外的MSN、Facebook,以及国内的QQ、微信等。这些社交媒体极大的增强
ERP(Enterprise Resource Planning,企业资源计划系统)是建立在信息技术基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台。0.acle ERP作为全球第二大E
近年来,随着Internet的迅猛发展,计算机互联网络已经成为越来越多网民生活中不可或缺的一部分。目前,互联网的规模特别是中国互联网仍然在不断膨胀,多种网络应用和网络资源使这个