X-DSP 64位SIMD位处理部件及混洗单元的设计与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:kaixinlfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信号处理器(Digital Signal Processor,DSP)是一门涉及多学科而又广泛应用于众多领域的新兴学科。步入21世纪以后,社会进入数字时代,而DSP正是这场数字化革命的核心。X-DSP是一款自主设计的高性能64位SIMD DSP,它采用VLIW技术,一拍可以发射11条指令,设计主频为1.25GHz。本文根据X-DSP的性能需求,在深入研究了目前主流DSP处理器体系结构与指令集系统的基础上,完成了64位位处理(Bit-Processing,BP)部件和混洗(Shuffle)单元的设计与实现,具体内容如下:⒈设计实现了X-DSP64位SIMD位BP部件。它作为X-DSP内核运算单元的功能部件之一,主要执行移位指令、位处理指令和打包解包指令。通过采用SIMD结构,可以一拍内完成两个32位数据操作,对程序的数据级并行提供充分的支持。⒉64位Shuffle单元作为一种向量数据交互网络,主要用于实现向量运算单元中各个VPE之间的数据交换。本文通过深入研究目前几种主流芯片的混洗指令设计特点,设计了自己的64位混洗指令及混洗电路结构。它采用独立的SRAM来存放混洗模式,这样使得应用程序在执行过程中可以与寄存器文件或访存带宽等系统的关键资源分离,提高了其执行效率。⒊本文在设计中对BP及shuffle进行了三个层次的模拟验证:模块级、部件级、SPE/VPE级,其中在模块级还结合了SVA形式化验证,保证了设计功能的正确性;在部件级,我们通过加载单个部件的测试激励,获得了相应模块的覆盖率。同时,我们还对混洗单元进行了性能测评,结果显示:在相同的混洗粒度下,X-DSP混洗模式存储器的混洗模式表示效率分别为0.88和0.75,在对比的几种混洗单元中为最高。最后,我们采用Synopsys公司的Design Compiler工具分别对BP部件及shuffle单元进行综合,结果显示:位处理部件的总面积为48513.7819um2,关键路径延时为0.42ns,功耗为28.1785mw;混洗单元的总面积为662016.8um2,关键路径延时为0.44ns,功耗为179.6060mw,均能满足X-DSP预期1.25GHz的性能要求。
其他文献
以贵州青山冲水库勘察成果为依托,在分析库区成库条件、坝基基本地质条件、坝基岩体工程性质的基础上,对库区渗漏、坝型选择等问题进行了评价,并对该类场地的工程地质勘察、评价方法进行了初步的探讨,供广大同行参考。
根据海河流域水资源公报等资料,以海河流域4个水资源二级区和8个省级行政区为单元,分析海河流域2001—2010年降水量及地表水资源量成果。与水资源综合规划成果[1]对比,海河流
基于依据一般规律不能清楚解释某工程基础第2、3电性层电阻率显著差别之因,而借助于以建立波速与电阻率相关试验成果逐一类比、解析引起电阻率显著差别的原因,从而深化对物探成果的认识,提高物探资料解译质量,基本达到知其然知其所以然。
第一章 总则 第一条 为加强工程勘察和工程设计单位的资质管理,保障国家财产人身安全,促进技术进步,提高工程勘察水平,根据《中华人民共和国建筑法》及有关法规,制定本规定。
以柔性悬臂梁为对象,对主动控制中的时滞辨识问题进行了研究。研究中将时滞辨识问题转化为一个优化问题,以系统某一段时间段的真实响应与预估响应之差的绝对值之和作为目标函
为更深入地研究岩石受载失稳过程中声发射(AE)撞击和事件参数对岩石内部损伤的响应关系,试验采用PCI-2全数字化声发射信号采集分析系统及TAW-2000型微机伺服岩石力学实验系统,
蒙医八味止血红花散治疗眼底出血30例临床报告(摘要)周爱春指导沈潜(内蒙古自治区医院010017)治疗方法:治疗以服用蒙药八味止血红花散为主。每日2次,每次1包,饭后温开水冲服,10日1疗程,最多服用2疗程
中国学术界关于实体正义与程序正义究竟谁应为优先者之争似乎已经陷入了二律背反。一方面 ,主张实体正义优先的学者不得不面对众多深具远见的学者对“看得见的正义”的迫切呼
《中国国土资源报》3月24日报道,中国钨业协会目前公布的统计数据显示,2005年我国五大钨矿工业集团的销售收入和利润大幅增长,全国钨行业销售收入261.3亿元,较2004年增长88.1%,销售利
目前,不少车间主任,都有一个共同的感觉——“如今的车间主任很难当!”的确:任务完不成,要受上面的气;正经管起来,要受下面的气。这真象“风箱里的老鼠——两头受气。”在我