BWDSP100编译器的研制及优化技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:A578964735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代DSP(Digital Signal Processor)处理器大多使用VLIW(Very Long Instruction Word,超长指令字)体系结构,它主要通过挖掘指令级并行性,即将多条指令放在同一时钟周期发射来获得高性能处理能力,这个任务通常是由编译器来完成的。随着在同一时钟周期发射数目的增加,对资源的需求也迅速增加,传统上使用的集中式寄存器文件很快就达到了设计的瓶颈。为了解决这个问题,越来越多的DSP处理器采用分簇体系结构,这也给编译器的设计带来了巨大的挑战。本文的主要工作是基于可重定向编译基础设施IMPACT为某研究所生产的一款DSP处理器BWDSP100开发C语言编译器,并针对DSP体系结构的特点和其应用领域对编译器的优化技术进行研究。主要包括研制和优化两个部分,具体的工作和贡献如下:1.为BWDSP100制定机器描述,并实现机器描述驱动的编译后端。机器描述主要通过描述目标机器的指令格式信息、资源使用信息、延迟信息和指令信息来将目标机器的指令集信息提供给编译器。这样编译器的后端可以很大程度上独立于目标机器并可以很方便的移植到各种平台。本文使用MD语言为BWDSP100编写了机器描述文件,减少了后端开发的工作量。2.针对BWDSP100的分簇体系结构,设计分簇算法。指令分簇的主要任务是将每一条指令分配到簇上,这个过程中要考虑到指令之间的依赖关系以尽量减少分簇结束后由于指令各操作数位于不同簇上而添加的簇间转移指令。我们基于DFG(Dataflow Graph,数据流图)提出了一种启发式的指令分簇算法,并考虑体系结构的特点进行优化,相对于传统分簇算法获得了8%的性能提升。3.针对体系结构特点和典型算法,对编译器进行了优化。设计了内建函数以在C语言中使用一些特殊机器指令,并针对调试模式和FFT算法进行了优化。实验表明,使用了这些优化措施之后BWDSP100编译器生成的汇编代码效率(时钟周期数)相对于主流DSP处理器TS201的编译器获得了30%的平均提升,在计算规模较大时性能更好。
其他文献
随着互联网技术的飞速发展,海量数据应用处理逐渐成为主流,而流数据系统则是其中最为典型的应用之一。作为新型的数据密集型应用,流数据具有有序实时到达,数据量接近于无限而
远程教育管理平台是西安电子科技大学网络教育学院的核心,承担着教学资源、教育活动的组织与执行等大部分功能。自2010年以来,远程教育管理平台服务的学生也越来越多,最终造成远
哈萨克语句子级别的分析技术主要包括词性标注,组块,句法分析和语义分析,现在哈萨克语处理已经进展到短语结构句法分析层面。本文主要对哈萨克语词性标注,组块和短语结构句法
随着时代的发展,手机已经成为人们生活中的必备品。3G时代的到来,智能手机越来越占据市场主流。在各种智能手机系统中,Android手机操作系统最受人青睐。该操作系统平台包含一
随着网络技术的不断发展,网络的服务能力不断的受到新的挑战。一方面在扩展性上,从只要求规模可扩展演变为在规模、安全、性能、服务、功能等的多维可扩展,另一方面,新需求的层出
近年来我们国家出台了一系列的政策加大推广普通话,越来越多的人报名参加普通话水平考试。通过对普通话水平考试现状的调查和分析,针对目前普通话水平考试面临的一些困难。于
温室环境调控是一个多输入、多输出、非线性强的控制过程,用常规的控制方法来处理有时很难获得比较理想的效果,因此,对温室的控制需要引入智能控制的方法来解决那些难以用传
随着机器翻译技术的迅速发展,命名实体识别与翻译研究取得了突破性的进展,它是在自然语言处理中的关键性研究分支。如今,汉语-维吾尔语机器翻译领域中开展了大量的研究工作。
随着模型驱动开发技术的逐渐成熟以及代码自动生成技术的出现,基于模型驱动的开发方法在软件开发领域被广泛应用。模型驱动开发使得开发人员可以更多地关注于系统逻辑设计,即在
蛋白质-蛋白质对接是指在两个蛋白质分子之间试图找到最好匹配,蛋白质-蛋白质相互作用过程中通常会发生骨架构象变化,蛋白质-蛋白质骨架柔性对接就是设计相应的对接算法和协议