面向MIC平台的OpenACC实现与优化关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:longyixu13543078183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构计算以其较高的峰值性能和较低的能耗成为当前研究的热点。随着GPU在通用计算领域的成功,Intel也推出了基于Intel Architecture(IA)架构的MIC(Many Integrated Core)协处理器,其第二代产品Xeon Phi已经成功部署在天河二号系统上。然而,异构系统的编程困难问题和性能优化问题在异构计算兴起时一直都是限制其推广和应用的障碍。近年来,Open ACC等采用编译指导的异构编程方法成为解决异构编程问题的重要途径,与CUDA等复杂的异构编程方法相比,程序员只需在串行程序中插入指导命令就可以使其在异构系统上高效的编译运行。目前,在MIC上还没有Open ACC的实现。本文主要以Open ACC在MIC上的实现为研究对象,将Open ACC指导命令采用源到源转换的方法映射到MIC的Intel Offload(简称Offload)编程模式上,并针对Open ACC指导命令的特点与MIC的体系结构提出了具体的性能优化方法,主要取得了如下成果:1、提出了Open ACC到Offload的映射模型。本文分析了基于指导命令的异构编程的三个要素,即任务管理、并行描述和数据管理。并从这几个方面逐一分析了Open ACC的指导命令与Offload接口的映射关系,并给出了源到源转换方法;同时通过对比Open ACC特点和MIC结构特点分析了映射转换效率。为Open ACC到Offload的转换及优化提供了理论基础。2、根据映射效率问题和MIC特点,提出了具体的优化方法。主要包括任务划分优化、向量化优化;同时由于在MIC上大量线程的开销问题,我们设计并实现了一种基于SIMD的可扩展组合树同步算法。3、实现了Open ACC源程序到Offload源程序的自动转换编译框架。采用模块化设计,编译框架前端模块将Open ACC源程序转换为中间表示,经过中端模块优化,后端模块将中间表示转换成Offload源程序。4、使用矩阵乘和JACOBI迭代的Open ACC源程序在CPU+GPU系统上和转换后的Offload源程序在CPU+MIC系统上测试转换效率。在同等规模下,转换后Offload源程序在MIC上运行的效率高于Open ACC源程序在GPU上运行的效率,而且都优于8核CPU的性能。
其他文献
随着信息采集和空间分析技术的迅速发展,如何集成海量的空间数据和大规模的计算资源进行空间分析和处理成为地理信息系统(GeographicInformationSystem,GIS)研究的热点。有效的
近年来,图像处理技术广泛应用于ITS领域,如:队列侦测、事故侦测、车辆识别和车辆统计等。本文将数字图像处理技术应用于交通场景的分析,主要研究使用无标度摄像机在视频帧中
网络入侵检测系统研究已成为计算机网络安全领域中的研究热点。建立网络入侵检测系统的核心是为正常行为或异常行为模式建模。由于大多数网络行为表现为一组与时间相关的序列
随着计算机硬件价格的下降以及计算机网络的不断发展,将计算任务分布到多个物理主机上处理,以提高任务计算速度和降低任务运算成本已经成为一个趋势。这种通过通信线路将多台
随着计算机技术和网络技术的发展,电子政务技术蓬勃发展,并被日益运用到政府各种行为中。政府通过电子政务的实现,不断提高工作效率,同时,人们也从中享受着由此带来的方便。
随着医学的发展,人们对肿瘤等恶性疾病早期诊断的要求越来越迫切。例如,在乳腺肿瘤的研究中,发现借助计算机辅助诊断(computer aided diagnosis,CAD)可以大大提高早期诊断率,
随着多媒体技术的飞速发展和网络的日益普及,数字作品的网络发行已成为新时代文明传播的重要方式。但是这些数字作品的原创者的版权和经济利益如何得到保护?数字水印技术是近
在物联网系统中,为解决物体识别的成本效益问题,RFID技术具有非常重要的作用。但在RFID文献中,大多数隐私保护协议需要阅读器在系统中搜索所有的标签以识别单个标签,其搜索复杂度
GIS(GeographicalInformationSystem,地理信息系统)网格服务是中山大学计算机系软件工程实验室提出并负责实施的广东省科技计划工业攻关项目,本文工作是该项目的一个重要组成部
本文主要研究了节点操作系统的体系结构以及资源管理和安全管理的若干关键技术,在此基础上实现了一个节点操作系统原型。 在节点操作系统(NodeOS)的体系结构方面,本文提出了