论文部分内容阅读
数字信号处理器(Digital Signal Processor,DSP)是一门涉及多学科而又广泛应用于众多领域的新兴学科。步入21世纪以后,社会进入数字时代,而DSP正是这场数字化革命的核心。X-DSP是一款自主设计的高性能64位SIMD DSP,它采用VLIW技术,一拍可以发射11条指令,设计主频为1.25GHz。本文根据X-DSP的性能需求,在深入研究了目前主流DSP处理器体系结构与指令集系统的基础上,完成了64位位处理(Bit-Processing,BP)部件和混洗(Shuffle)单元的设计与实现,具体内容如下:⒈设计实现了X-DSP64位SIMD位BP部件。它作为X-DSP内核运算单元的功能部件之一,主要执行移位指令、位处理指令和打包解包指令。通过采用SIMD结构,可以一拍内完成两个32位数据操作,对程序的数据级并行提供充分的支持。⒉64位Shuffle单元作为一种向量数据交互网络,主要用于实现向量运算单元中各个VPE之间的数据交换。本文通过深入研究目前几种主流芯片的混洗指令设计特点,设计了自己的64位混洗指令及混洗电路结构。它采用独立的SRAM来存放混洗模式,这样使得应用程序在执行过程中可以与寄存器文件或访存带宽等系统的关键资源分离,提高了其执行效率。⒊本文在设计中对BP及shuffle进行了三个层次的模拟验证:模块级、部件级、SPE/VPE级,其中在模块级还结合了SVA形式化验证,保证了设计功能的正确性;在部件级,我们通过加载单个部件的测试激励,获得了相应模块的覆盖率。同时,我们还对混洗单元进行了性能测评,结果显示:在相同的混洗粒度下,X-DSP混洗模式存储器的混洗模式表示效率分别为0.88和0.75,在对比的几种混洗单元中为最高。最后,我们采用Synopsys公司的Design Compiler工具分别对BP部件及shuffle单元进行综合,结果显示:位处理部件的总面积为48513.7819um2,关键路径延时为0.42ns,功耗为28.1785mw;混洗单元的总面积为662016.8um2,关键路径延时为0.44ns,功耗为179.6060mw,均能满足X-DSP预期1.25GHz的性能要求。