面向矢量信号处理的自动向量化算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xiaogege0451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为满足无线通信对实时性、低功耗的要求,信号处理器多采用SIMD(single instruction multiple data,单指令多数据)架构以加速对程序的处理。本文依托动芯矢量DSP(Digital Signal Processor,数字信号处理器),在LLVM(Low Level Virtual Machine,低级虚拟机)编译框架下改进并实现面向基本块的自动向量化算法,全文研究内容如下:1.深入研究LLVM中以基本块为单位的传统自动向量化算法,并分析该算法目前影响向量化效果的原因。2.通过分析自动向量化算法,发现基本块内部指令数目较少以致于向量化挖掘困难,因此本文通过调研行业现状采用循环正规化方法扩展基本块内指令数目,加大并行指令挖掘范围。3.自动向量化中的大规模并行指令对选取算法依赖于生成有向无环图和使用深度因子修剪有向无环图中冲突节点的方法实现,因此深度因子的好坏直接决定向量化优化效果。目前在依赖关系较为复杂的条件下原算法的深度因子已不能满足最初设计需求,易造成修剪枝时的误判,最终影响程序的向量化效率。本文从以下三点优化原算法:1)改进静态深度因子,获取更加正确的先验信息以修剪枝,从而提高优化指令数。2)构建动态深度因子,使得修剪枝时获取的指令链更长。3)使用深度因子改进子树的构造顺序,合理利用深度因子对优化潜在性的表达,使得深度因子大的子树先生成,降低子树生成的随机性,最终提高程序优化效率。4.研究广度因子替代深度因子的自动向量化方法,并在LLVM平台上实现该算法,实验结果表明在寄存器压力和复杂度的影响下,该方法运行时间过长,限制了它的应用。最后,在LLVM编译架构下实现改进的自动向量化算法,并使用行业通用测试例进行验证,实验结果表明改进的自动向量化算法主要从两个方面影响向量化效果:1)并行指令数的提升。2)在生成相同数目向量指令的条件下,产生更少的额外开销。
其他文献
多标签分类算法是机器学习中的一个重要方向。多标签分类算法可以用来解决同时具有多个标签的样本数据的分类问题以及排序问题。其研究成果广泛地应用于各个领域,如文本信息
旧区改造是重大的民生问题,经过对近些年闸北旧改工作的梳理,发现很多政策创新、试点始自于闸北。本文将以闸北区旧改工作为例,探讨公民参与征收工作的效果以及存在的问题,进
高质量高分辨率的图像在如今社会的各个领域都是迫切需求的,为了获得高分辨率的高质量图像,近年来图像超分辨率重建技术有了广泛的研究,图像超分辨技术也达到了一个顶峰,各种
二十一世纪,知识将逐渐成为全新的、举足轻重的无形资源,有效的知识管理将促进社会组织获得前所未有的绩效提升。知识分为显性知识与隐性知识,作为隐性知识的载体,人也是一种
随着云计算技术的不断发展,越来越多的企业和个人将业务系统迁移到云平台上,使得云平台的规模不断增大,给提高云服务可靠性带来了巨大的挑战。虚拟机作为云平台的基础组件,其
近年来,随着信息技术的不断发展,学术领域中,学术合作网络规模也不断得以壮大和发展。并且,学术合作作为学术领域重要的交流方式,也吸引了大量的学者纷纷参与到学术合作当中
Android系统已经成为移动端操作系统领军者,Android应用也以爆发式的飞速发展。伴随而来的则是隐藏在普通应用中的恶意应用,这些应用可能盗取个人隐私,恶意扣费,暴露账号信息
随着互联网技术的发展,人们可以随时随地进行视频拍摄并上传,造成了网络视频数据的大规模增长。同时,盗版侵权等违法行为也制约着网络视频的发展。为了快速地对相似性视频进
大范围频发的雾霾天气下,户外场景的能见度显著下降,致使采集的户外图像出现对比度低、细节模糊、色彩暗淡等降质现象,极大限制了依赖户外清晰图像工作的交通监管、智能驾驶
改革开放以来,我国食(药)用菌产业发展迅速。到目前为止,我国已经成为世界食用菌生产大国,菌业也成为我国农业生产结构中的第六支柱产业。福建省以菌业作为优势特色产业,其食