面向片式结构多核处理器的流编译优化方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liongliong468
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
片式结构(Tile)多核处理器以其良好的可扩展性和低能耗性已经成为一种重要的多核架构。数据流编程(Data Flow Programming)作为一种开发并行性的有效方法已经被广泛应用于多核处理器。然而,Tile多核处理器在提供强大的计算能力的同时,将更多的底层细节暴露给编程人员,包括层次性的存储和显式的通信传输等,给Tile多核处理器上的流编译技术带来了新的问题和挑战。因此,为了提高数据流程序在Tile多核处理器上的执行效率,对Tile多核处理器上的流编译技术进行了相关研究。针对目前数据流模型在理解和编程上的不便,设计并实现了DFBrook数据流编程语言及相应的编译系统。DFBrook对标准C语言语法进行了扩展,提供了对数据流模型编程的支持。程序员可以通过在C代码中加入数据流代码来实现对特定程序模块的数据流执行。编译系统在词语法分析后生成语法树,针对该语法树建立一种中间代码表示---同步数据流图。然后,结合Tile结构多核处理器的结构特点,确立了一个三级优化策略:软件流水调度,存储访问优化和核间映射的通信优化。软件流水调度利用整数线性规划的方法将任务均分到每个处理核上,实现负载均衡。在此基础上,提出了一个混合存储分配算法来充分利用系统上的存储资源并对软件流水中冗余的缓冲区拷贝进行消除,同时,对多核平台上复杂的网络通信进行了优化,进一步减小网络负载,降低通信开销。在三级优化之后,生成面向目标多核平台上的多线程代码。实验以Godson-T为主要的实验平台,选取了数字媒体中典型的算法作为测试程序,对不同的优化策略进行了实验对比与分析。实验结果表明,设计的编译优化策略获得了较大的性能提升。
其他文献
基于构件的软件开发方法(Component-Based Software Development)被视为解决“软件危机”的有效途径之一,构件库是这一方法的基础设施。但是单一构件库的规模不能满足软件开发人
在物联网中,由于物的信息具有多样化的描述形式且机器不能够完全理解这些物的信息(物联网的内在矛盾),进而很难有效地为普通用户提供语义服务。语义物联网能够消解物联网的内
近些年,随着遥感影像技术的高速发展,多源遥感影像融合也成为该领域研究的一大热点。遥感影像融合己成为影像处理领域中不可或缺的技术之一,并在诸如农业发展、军事应用、土地规划等领域起着重要应用。然而许多实际应用中,遥感影像的不同区域对空间细节信息与光谱特征的要求并不完全相同。而针对这种区域的不同需求,目前的遥感影像融合技术大都难以实现准确、及时、高效地分区域的影像融合。针对该问题,本文在国内外相关方法阅
视频标签是用来描述视频特征的短语,通常用于视频检索和视频推荐。现有视频标签的研究中存在如下的一些问题:现有视频标签大部分是描述视频总体特征,没有针对视频具体片断进行描
真实感是利用计算机虚拟现实技术进行模拟时所要追求的目标之一,通过物理模拟技术对场景中物体的运动进行模拟,使其符合真实世界的物理规律,可有效地提高虚拟场景的真实感。
随着科学技术的高度发展以及商业文化交流的高速膨胀,信息的传播越来越要求通过高科技手段来实现。数字多媒体终端是一种新兴的媒体概念,具有实时信息发布与联网广告发布的功能
增强现实技术作为虚拟现实的拓展技术,在最近十几年里已经得到了飞速发展,并在各个领域显现出强大的应用价值,广泛应用于工业、产品展示、医疗研究、军事、教育等领域,成为虚
Web服务作为一种自主而开放的应用实体,具有松散耦合、平台无关、互操作性强等特点,特别适合在Internet环境中发布和使用。随着互联网上Web服务数量的快速增长,如何从中快速
随着数据价值不断提升,分布式存储系统中的数据加密存储变得更为重要。为降低对存储系统的信任,以满足对用户隐私保护的需求,端对端的加密存储应运而生。对象存储设备因其智能管
信息化高速增长,带动磁盘理论技术的进步,磁盘记录密度保持着约30%平均年增长率。超顺磁影响的限制制约着磁盘记录密度的无限提高,出现在磁盘市场上磁盘中最高磁记录密度日益接