面向计算密集型嵌入式应用的VLIW编译优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:net130130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,应用对计算的需求也不断增加。与传统桌面应用领域不同,在科研、国防、商务、娱乐等众多领域,计算密集型应用正成为微处理器的主要负载,日益吸引人们的关注。而高端嵌入式计算因为其强大的应用需求背景,发展一直非常迅猛。目前嵌入式应用对计算性能、功耗的渴求早已超出了当前嵌入式处理器的能力。作为开发并行性的一个有效方法,VLIW技术仍然在目前的微处理器设计中起着非常重要的作用。VLIW技术可以降低硬件复杂度、提升芯片频率、降低功耗,另一方面也对编译器提出了严峻的挑战:处理器的性能更加依赖于编译器的性能。然而随着VLIW处理器体系结构的不断革新、应用领域的不断扩展,编译器如何才能充分利用体系结构上的性能、功耗等优势,尽可能的开发指令级并行性,针对不同的微处理器体系结构面临着不同的问题。在这样的背景下,作者选择了“面向计算密集型嵌入式应用的VLIW编译优化技术研究”作为论文课题。本文重点研究了计算密集型嵌入式应用在VLIW处理器上运行时面临的若干关键问题,包括数据级并行多线程在VLIW处理器上的软件集成、分布式寄存器文件的负载均衡调度、流处理器上部分互连结构的设计和指令调度以及面向能耗有效微处理器的编译优化技术。本文的工作和创新主要体现在以下几个方面:1.提出了一种轻量级数据级并行多线程在VLIW处理器上软件集成执行的方法。OpenCL规范下的多线程是一种数据并行的多线程,同时其单个线程负载较轻,在VLIW处理器上执行难以充分发挥处理器的性能优势。本文实现了OpenCL规范下的多线程在MASA流处理器运算簇上的软件集成并行执行。根据数据级并行线程程序结构相同的特点,编译器将不同线程之间相应的基本块的操作合并到一起,扩大了编译器可以调度的指令窗口,将数据级并行转化为指令级并行,充分发挥VLIW处理器的性能。实验结果表明,集成适当数目的多线程执行可以在有效提高程序的性能同时,将程序对处理器硬件资源的需求控制在一个可接受的范围内。2.提出了分布式寄存器文件结构中寄存器文件负载均衡的VLIW调度算法。分布式寄存器文件的负载不均衡使得寄存器不能被有效的利用,过高的寄存器文件需求峰值往往导致溢出访存,进而降低性能,抵消其优势。本文针对分布式寄存器文件结构提出了一种寄存器文件负载均衡的VLIW调度算法。通过分析程序的控制结构以及变量的生产者-消费者关系,本文提出了在指令调度时定量精确计算变量生命周期的方法。通过在每一个操作调度完毕后精确计算每个寄存器文件的负载,优先将变量分配到负载较轻的寄存器文件来平衡不同寄存器文件之间的压力。实验结果表明该方法能够有效减少程序对分布式寄存器文件的峰值需求,减少溢出访存。3.提出了流处理器中部分共享互连结构设计和面向部分共享互连结构的指令调度优化算法。流处理器中大量的功能单元和全交叉的互连结构使得其共享互连总线的规模非常庞大,增加了硬件资源开销、传输延迟和硬件布局综合的难度。在进行程序特征分析的基础上,本文通过流处理器中的I/O单元复用技术和部分共享互连结构设计来降低共享互连总线的规模,并通过编译器的优化调度尽可能的利用现有的互连资源,弱化部分互连结构对程序性能的影响。实验结果表明,编译器的优化调度有效避免了程序性能的大幅下降,互连资源的利用率则得到了大幅提升;部分互连结构设计可以有效的降低处理器的硬件开销和能量消耗。4.提出了面向分布式与层次化寄存器文件结构的变量分类调度算法,为能耗有效的微线程处理器设计实现了Thread级的编译器。本文提出了面向万亿次量级的嵌入式处理器研究,介绍了其最底层的微线程处理器结构以及Thread级程序设计模式,为微线程处理器设计实现了Thread级的编译器。为了降低功耗,微线程处理器中采用了分布式与层次化的寄存器文件结构。TORF的极小容量使得很多数据必须存放在ERF中,这使得指令调度变得更加困难。通过分析程序特征,本文提出了面向分布式与层次化的寄存器文件结构的变量分类调度算法,避免了程序员手工分配优化的难题。实验结果表明,相比于分布式寄存器文件结构,变量分类调度算法能够在程序性能略有降低的情况下,大幅降低访问寄存器的能量消耗以及整个处理器的能量消耗,使得分布式与层次化寄存器文件结构的功耗优势得以充分发挥。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
在证券执法过程中,为了制止、预防证券违法行为,补救证券违法后果和保护投资者利益,应当赋予证券执法主体享有请求司法机关(法院)通过司法程序对证券违法行为予以裁判的权利
摘要:本文提出将先进的CFD数值试验方法引入工程流体力学的教学中,生动、形象地展示了弯管流动以及翼型绕流两种典型的流动现象,将抽象的概念与理论转为可视化的流动图像,直观地揭示了流场特性,并结合理论公式进行讲授,促进了学生对所学知识点的深入理解,对工程流体力学理论教学形成有益补充,从而达到激发学生的学习兴趣,改善教学效果的目的。  关键词:工程流体力学;CFD数值试验;教学  中图分类号:G642.
会计工作的目标是能够给企业提供决策的有效信息,依据真实会计信息为企业发展进行决策的信息数据支撑。但是会计信息真实性受物价变动影响,需对物价变动对会计工作产生的多重
在瓦斯隧道施工中,通风施工各工序是重中之重。本文通过对隧道施工通风的设计原则及影响因素的分析,提出了保证通风效果的技术措施。
生活中,实际工程中的优化问题存在着高维数、大计算量、多局部极优值等复杂特点。这使得传统优化算法的求解无法达到实际应用要求。所以研究新的优化方法以解决此类复杂的优
本篇论文的研究是在863计划——“高可信软件生产工具及集成环境”中的子课题5“面向流程管理的软件生产线”的支持下进行的。主要研究方向为工作流过程模型及其能力分析以及
本研究通过对标准蜂箱的巢门、箱体、巢框和上下箱体连接器等方面进行了改良设计,然后系统研究了改良后的标准蜂箱对意蟑春繁和产浆性能的影响,同时比较了改良标准箱与常用标准
随着美国经济复苏,市场对技术人才的需求正日趋加大。根据美国劳动局的数据,2014年第四季度,软件开发人员的失业率仅2.5%。但招到软件专家并非易事,十大最难招满的职业中有七个与计