面向BWDSP的SIMD编译优化技术研究与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:caculate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
BWDSP是一款采用分簇体系结构、支持SIMD的16发射的VLIW浮点运算数字信号处理器。由于其具有强大的并行处理能力,能够较好得满足实时信号处理的要求,被广泛应用于各种高性能计算领域。本文在面向BWDSP目标体系结构、基于开源编译基础设施Open64的OCC编译器上设计并实现了针对程序循环部分的SIMD编译优化技术及其后端相关编译优化。OCC编译器在其层次化的中间语言WHIRL上进行SIMD编译优化。优化之前首先对程序循环体进行循环嵌套优化,将其中一些具有特定格式的程序转换为BWDSP所支持的高效特殊操作指令。SIMD编译优化阶段首先对候选循环进行预分析,剔除那些不易进行SIMD优化的循环程序,然后再进行收益分析计算、依赖关系分析优化和单双字寻址模式判别,根据循环体特点和寄存器压力选择出循环体中能够进行SIMD优化的指令类型,OCC编译器采用两套寻址模式能够同时支持多簇单字和多簇双字、以及复数寄存器对的SIMD编译优化,最后根据分析结果选择出其所支持的向量化类型进行SIMD代码生成。本文采用一些常用的DSP算法程序作为测试,比较了SIMD优化前后程序的加速比,实验结果表明SIMD优化前后程序的性能能够得到很大的提升。OCC编译器后端的代码生成模块是与BWDSP体系结构最为密切相关的部分,因而有必要针对SIMD编译优化进行后端重定向。根据BWDSP的硬件资源和指令集特点,扩展后端代码生成模块中的各个阶段,完成SIMD编译后端相关的优化。该模块中主要阶段包括机器描述、SIMD指令注释、SIMD指令分簇、SIMD分簇寄存器分配和SIMD代码生成等。最后本文采用上述的DSP算法程序作为测试集,将面向BWDSP的OCC编译器和面向ADI TS201的C编译器进行SIMD优化后的性能对比,结果表明OCC编译器的SIMD优化性能大体是TS201 C编译器的2.5倍左右。
其他文献
随着下一代电信网和Internet技术的快速发展,网络基础设施逐步完善,网络带宽不断增加,为多种业务(语音、数据和多媒体等)的广泛开展提供了良好的硬件环境。企业间业务共享、
随着市场经济不断发展,企业间多元化竞争日趋激烈,企业想在激烈的竞争中处于不败之地,就必须考虑如何降低传统成本。而采购、库存、生产配比等环节是大多数企业,尤其是生产装
本文研究题目来源于国家“十一五”科技支撑计划课题“勘察设计企业信息化关键技术研究与应用”子课题“基于SOA技术的勘探设计企业应用软件架构系统”。  在Web服务环境中
随着信息技术的不断发展,网络的不安全因素也随之增加。虽然传统的安全设备和安全检测方法得到了广泛的应用,但都没有从宏观的角度为网络管理员提供清晰的网络安全状态信息。
随着深度学习在各个领域的普及,神经网络参数的规模越来越大,训练的周期也越来越长,多GPU加速成了必然的硬件解决方案。为了最大化多GPU的硬件利用率,本文研究和实现了深度学
语音编解码协议是语音在网络上传输的重要因素之一,高质量的语音编解码算法又是协议的精髓所在,而且低速率的语音编码器节省了大量的带宽,因此一个性能卓越的算法不仅能够提
P2P (Peer to Peer)网络模型凭借其低廉的部署费用和丰富的共享资源等优势,迅速地在互联网上流行起来。P2P网络中完全地抛开了服务器的存在,资源分布地存储在整个网络当中,因
网络信息资源的极大丰富和无序使得信息检索成为当今信息领域的热点问题,而个性化信息检索的需求也日益迫切了。虽然已经存在一些个性化信息检索系统,但是它们使用的是传统的
传统的基于文本的检索方法是对图像数据库中的每一幅图像进行关键字描述,根据关键字对用户给定的图像进行检索,基于内容的图像检索是使用图像的颜色、纹理和形状图像内容,建
随着信息技术的进步和计算机技术的广泛引用,互联网已经渗透至社会生活的各个角落,网络环境日益复杂,网路变得更加繁忙,互联网基础设施承受着更大的压力。但网络基础设施本身