1GHz向量执行部件的设计与优化

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:liongliong525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
YHFT-XX是一款国产的高性能多核数字信号处理(DSP)芯片,内核采用11发射超长指令字(VLIW)结构,单条指令40或80位。向量处理部件(PXX)是DSP内核中面积最大的一个模块,每个PXX内部包含16个向量执行部件(PX),PX性能的好坏直接关系到整个芯片的性能。这款芯片要求DSP主频达到1GHz以上,这一设计目标对PX的设计与优化提出了严峻的挑战。本文首先通过分析PX的整体结构确定了层次化设计方法,根据DC综合结果确定了各个模块所必须采取的优化策略,然后采用不同的优化方法对PX内各个模块进行了优化设计,有效地减少了面积、降低了功耗、达到了1GHz以上工作频率的设计目标。本文的主要工作与成果如下:1、基于ASIC自动综合的方法得到了整个PX中各个子模块的时序和面积数据,经过综合结果分析,确定了层次化综合策略和不同模块采用不同优化措施的整体优化方案。首先在微体系结构级对关键路径进行优化,然后对向量寄存器文件(RF)和向量乘累加(Multiply and Accumulator,MAC)部件中的64位乘法器采用定制设计与优化方法,其它子模块采用半定制设计与优化方法。2、研究分析了各种微体系结构优化方法,并对RF中旁路译码模块、存储阵列写译码模块和旁路阵列等关键模块进行了优化设计,其关键路径可以减少15%的延时,32位乘法器面积减少64%。3、完成了RF模块的全定制与半定制混合设计优化和64位乘法器模块基于数据流驱动的手工半定制设计优化,以及其它模块的半定制设计,有效地缩短了设计周期、减少了面积、降低了功耗、提高了性能。64位乘法器和RF中全定制模块时序满足1GHz的设计目标,同时面积满足设计需求。4、完成了对PX各模块的层次化物理设计与集成。首先分别对MAC和RF进行物理设计,其中对RF中旁路阵列与二选一和64位乘法器采用基于数据流驱动的手工半定制物理设计方式实现,最后在PX顶层调用RF中的全定制宏模块和采用半定制设计的模块MAC,完成整个物理设计的集成与优化,取得了显著的效果。在时钟周期为950ps的约束下,PX两种布局方案都满足设计要求,其中reg2reg路径存在约70ps的余量。物理设计后PX能够在40nm工艺下达到1GHz以上的频率,两种布局方案均达到设计要求。
其他文献
目的:探讨传染病的SIR模型.方法:通过微分方程解的特征,对于按照一般传播机理建立的SIR模型,分析受感染人数的变化规律,预报传染病的高潮时间,得出控制传染病蔓延的方法.结果
沥青路面易受到自然环境及外界荷载等因素影响而产生病害,需要检测部门对沥青路面病害进行定期检测。鉴于此,首先概述了沥青路面常见的病害种类及特征,然后分析了病害的成因,
通过试验研究了混凝土中粉煤灰对引气剂所引含气量的影响,试验结果表明:混凝土中掺入劣质粉煤灰,混凝土拌合物含气量会随粉煤灰掺量的增加而降低,掺优质粉煤灰较不掺加时混凝
近期日本APA连锁酒店因在客房内放置否认南京大屠杀和慰安妇历史的书籍,引发了中国人民的强烈愤慨。事件发生后,此书的作者、APA酒店社长元谷外志雄不仅没有道歉,反而公开表示拒
报纸
软件测试是软件开发过程中的一项耗时费力工作,其成本又主要受制于错误定位的时间花费。为此,程序故障(错误)定位技术的目的在于自动地、快速准确地定位程序中出现的错误。现
本文以沈阳市某供热公司3号锅炉的多管除尘脱硫一体化设备为研究对象,针对其除尘脱硫效率低的问题对其进行优化改造。基于影响设备除尘脱硫效率的主要因素以及工程的实际情况
由于英汉文化无论在地理环境、风俗习惯、社会历史、宗教信仰等方面都存在差异,因此具有各自民族特色的两种习语的互译就必然存在困难。归化与异化翻译法可以从不同的角度诠
随着超大规模集成电路技术的发展,芯片尺寸日益缩小,带动了光刻技术的进步。由于光刻技术的分辨率要求越来越高,193nm光阻(Photoresist:PR)成为248nm光阻的替代者。而由于两
应用型本科院校英语专业的翻译课程是培养复合型人才必不可少的主干课程,本文以功能翻译理论为指导,从课程定位与设置、教学内容与方法、师资培养与团队建设等方面,系统地探