基于深度学习的程序并行化方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tonze5082
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能计算技术的快速发展,并行编程技术在实际工程应用中占据着越来越重要的地位。尤其是在科学计算相关领域,并行化技术成为了解决程序结构复杂、计算量大、数据密集以及执行周期长等问题的关键途径。然而,现有的程序并行性分析工具在处理具备上述特征的程序时仍存在着较大的局限性,且目前的多种并行编程手段在使用时缺少统一的标准编程接口。因此,串行程序的并行化在程序的并行性识别和并行程序开发两个阶段均存在着较大的难度,研究一种在上述两个阶段均具备良好表现的串行程序并行化方法是十分必要的。本文借助深度学习技术来研究串行程序的并行化方法,重点研究了串行程序的并行性识别和并行程序开发两个方面,提出了包含数据集、并行性识别方法、标记语言和编程辅助平台的一整套解决方案,主要工作如下:(1)提出了一种基于深度学习的串行程序并行性识别方法。本文将串行程序的并行性识别视为二元分类问题,建立了一个基于深度图卷积神经网络(Deep Graph Convolutional Neural Network,DGCNN)的深度学习模型,构造了一个通用图数据集GFCPD(Graphs For Code Parallelism Discovery,程序并行性识别图数据集)。并通过模型在GFCPD数据集上的表现验证了深度学习方法在串行程序的并行性识别问题上具备可行性与有效性。站在新的角度,针对串行程序的并行性识别问题提出了新的解决方案。(2)设计并实现并行标记语言PML及编程辅助平台。本文使用XML技术实现了并行标记语言PML,为不同的并行编程模型提供了格式统一的PML标签用于结合C/C++语言进行并行程序开发,为多种并行编程手段的混合使用提供了统一的标准编程接口和更加简易便捷的途径。此外,本文搭建了一个并行编程辅助平台,从串行程序的并行性识别、并行程序开发、并行程序调试三个方面提供了完整的串行程序并行化流程,有效地降低了并行化技术的使用门槛。
其他文献
学位
学位
随着新浪微博、微信等社交媒体的崛起,互联网媒体及电子出版物代替了传统报纸等纸质出版物成为人们发布和获取信息的主要渠道。网络的飞速发展以及各种移动终端设备的流行促使网络电子文本信息的爆炸式增涨,如何从海量电子文本信息里快速汲取有效信息逐步成为研究热点问题,文本摘要自动生成技术正是解决这一问题的核心。文本摘要自动生成技术不仅仅可以提升获取信息的效率,更支撑了智能应答系统、网络舆论解析等上层应用的建设。
在实际学习与科研中,许多情况下需要将灰度图像渲染成彩色图像,例如将黑白照片着色、对夜视成像效果进行彩色化等等。现较为流行的灰度图像着色的方法是专业技术人员借助专业的图像处理软件如photoshop将图片分区,之后通过调整各个分区色相和色彩饱和度来完成上色,整个过程相当复杂。在计算机视觉领域,也有利用传统的数字图像处理技术如基于颜色传递、基于颜色标记等方法实现灰度图像着色,但是,该类技术往往需要处理
在汽车发动机性能开发中使用机器学习算法对发动机的经济与排放性能进行回归分析是不同于传统的技术手段,使用基于机理的数值预测模型能够实现最佳的预测精度,但是要想达到理想效果难度较大。而基于机器学习算法的回归预测方法能够降低技术难度,提供一种新的技术尝试。本文基于机器学习的多种算法对发动机的BSFC、NOx、HC、CO和CO2参数进行回归预测研究,使用遗传算法对回归预测模型进行超参数调整,优化模型预测表
地震波模拟是地球物理科学研究不可或缺的一部分。在地球物理学中,数值模拟揭示了一些物理场信息,这些物理场在测量时是不容易获取的,因此通过数值模拟可以更好地了解场的行为和地下结构。在进行地震波模拟计算时,对于较小的模型,可以使用单个计算节点进行波场的数值模拟。但是,当规模较大时,这一运算效率远远不能达到工业化的应用要求。更何况是,当模型巨大时,往往单个计算节点的内存很难满足整个计算过程的要求。解决这类
石油,作为世界最主要的一次能源,影响着工业的发展与科技的进步。随着世界对原油需求的不断增加,原油产量也不断增加。我国作为原油进口大国,原油储量严重制约工业的发展。我国从2004年开始实施战略石油储备项目,至今还未形成满足全国90天消费需求的储备能力。大型储油站所的建立,导致对储油罐内原油加热的方式越来越受到重视。射流加热作为一种加热速率高、能耗少的加热方式逐渐应用到大型储油罐内。总的来说,储油罐内
电磁成形可以改善难成形材料的成形性能,该成形过程是一种高速动态大变形过程,具有成形时间短、成形力分布均衡的特点。传统数值方法中的有限单元法因其通用性受到工程技术界的广泛重视,然而在处理上述问题时,传统的有限单元法存在着无法避免的精度过低、计算过程复杂等缺陷。同时,许多数值算法在求解大型复杂问题时计算成本与计算精度难以获得较好的平衡。而光滑有限元算法则使用低阶非结构网格,在保证计算效率同时可获得高精
作为锂/钠离子电池负极材料,锐钛矿TiO2与尖晶石结构Li4Ti5O12分别具有335 m Ah g-1和175 m Ah g-1的理论比容量,且具有体积膨胀低、储量丰富、环境友好等优点。但两种材料均存在导电性差和离子扩散率低的问题,导致其储锂/钠性能不佳。本文利用碳化过程中过量的碳对活性材料颗粒长大的抑制作用,通过喷雾热解和碳化法制备了火龙果结构的3.3 nm尺寸的TiO2/碳(3.3-TO/C
在计算机和多媒体技术不断发展和成熟的今天,看电影也逐渐成为人们的日常娱乐活动,但互联网大数据的到来也同样带来了信息过载的问题,如何在数量和种类繁多的电影中找到用户所喜欢的,也是在推荐系统研究中的首要问题。电影推荐方面,传统的协同过滤推荐算法主要以用户对电影的评分作为推荐的依据,而用户和电影的其他多种特征数据,如用户的年龄、职业、爱好,电影的简介、评论等大多数重要的信息都没有充分利用起来,这样做的缺