基于粗粒度可重构处理器的任务映射技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 3次 | 上传用户:blogbee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗粒度可重构处理器(Coarse-grained Reconfigurable Architecture,CGRA)作为一种新的高性能计算结构,兼具通用计算与专用计算的优势,在编程灵活性和计算能效上具有较好的折中。CGRA的性能优势主要依靠较为先进的编译器将计算密集型应用映射到丰富的并行计算资源上,而编译器中的任务映射策略决定了应用的执行性能。因此,任务映射技术的研究一直以来都是可重构计算领域的热点,受到众多学者的关注。随着可重构领域的不断发展,任务映射取得很多成果,但依然存在以下问题:(1)映射过程中,任务划分后子任务内的操作算子并行能力不足;(2)循环映射中欠缺考虑数据访存冲突问题;(3)不完美嵌套循环整体映射性能较差。针对上述问题,本课题从CGRA高效并行计算结构的特点出发,将应用任务抽象成数据流图,考虑数据依赖和硬件资源等约束,从以高并行度为主的多目标任务划分、避免数据访存冲突的循环映射和提高整体映射性能的不完美嵌套循环优化三个方面构建问题模型,并设计优化算法求解。最终提高任务映射性能,降低应用在CGRA上的总体执行时间。具体地,其主要创新工作如下:1.针对映射过程中,任务划分后子任务内的操作算子并行能力不足的问题,提出一种基于并行度最大化的多目标任务划分算法。该算法采用广度优先的搜索方式,在合理利用硬件资源和不增加子任务间通信开销的策略下,最大化子任务内的操作算子并行度。仿真结果表明,该算法降低各子任务的执行延迟总和,同时还实现降低配置开销和通信开销的多目标。2.针对CGRA循环映射中数据访存冲突导致映射性能不高的问题,提出一种联合优化模型,该模型针对多存储体结构的CGRA将访存冲突考虑到循环映射问题中,并构建路由开销函数选择路由方式。根据该联合优化模型设计了相应的算法,算法利用细粒度存储划分提高数据存取的并行性,并引入路径重用策略优化路由资源。实验表明,该方法可以有效避免访存冲突,提高循环映射的性能。3.针对CGRA不完美嵌套循环整体映射性能较差的问题,提出一种操作级别仿射变换与多流水相结合的不完美循环映射优化模型。该模型提出操作级别的仿射变换对不完美循环进行预处理,通过多流水方法将内层和外层迭代同时流水。设计的算法利用资源约束和最小化总体执行延迟来引导搜索空间,降低模型求解难度。实验结果表明,该模型可以有效提高不完美嵌套循环的整体映射性能。
其他文献
结构助词是现代汉语使用频率比较高的词,也是汉语语法研究的重要组成部分。汉语结构助词“的”在印尼语也有对应的相关词虚词,但并不是汉语结构助词“的”都需要在印尼语中用
在综合考虑受控非线性机械系统的建模误差、参数不确定性、执行器故障、外界干扰等因素下,如何实现自主可靠、保瞬态与稳态性能的非线性系统控制在理论和应用上具有重要意义
历史文献翻译作为翻译的一个分支,在连接中西方文化,扩大中国对外学术文化交流的过程中发挥了主要沟通桥梁作用,具有十分重要的现实意义。与此同时,历史文献翻译在日益密切的
翻译是重要的文化交流方式。在文学研究和学习方面,对于叙述性文本的翻译一直发挥着非常重要的作用。原文本《2.遇见卢塞夫先生:电视时代下的英规电影院发展史》(2.BRITAIN:M
随着社会的进步和国民文化素养的提高,个人心理健康也渐渐被国民所重视。人们对心理学知识的需求日益增长,为国外大量心理学理论和科普书籍的译入带来了广阔市场。该领域文本
本文將汲古閣本《說文解字》與平津館本進行文本的全面比對,并以日本靜嘉堂藏宋本、國家圖書館藏宋本、四部叢刊影印之述古堂影宋抄小徐本三種作參校,以此展示汲古閣本《說文
本文是对林沄先生的《古文字学简论》(中华书局2012年版)前言及第一章第一部分的翻译及翻译报告。《古文字学简论》主要讨论汉字的分类、考释古文字的途径、汉字字形历史演变
学位
近年来,随着微电子技术和无线通信技术的不断发展,无线传感网络(Wireless Sensor Network,WSN)的应用范围越来越广泛,在各个领域都有相关的应用。由于传感器本身缺少有效的安
近年来,国内外大规模停电事故时有发生,通过分析与总结事故原因发现,电力系统继电保护及自动装置的不正确动作是导致电网发生连锁故障的重要因素。因此,有必要深入研究继电保护及自动装置在停电事故中的作用机理,提出评估系统停电风险的指标与方法,并针对不同的电力网络设置相应的降低停电风险的保护配置方式。本课题以国家电网公司科技项目“基于多沙堆理论的互联电网停电事故预警技术及系统研发”为背景,是子课题“考虑电网