深度学习分布式训练并行策略的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hjlcd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络的分布式训练包含模型并行,数据并行等不同策略。传统模型并行流水化策略将深度神经网络按层分配到不同计算设备上,通过重叠计算时间与通信时间减小分布式通信的开销,但是该策略将神经网络模型中的分支和捷径与其他神经网络结构看作一个整体,在切分模型时难以保证结果的均匀分布,导致训练迭代时间增加。数据并行通常使用同步法进行计算设备间模型参数的更新,在每个迭代周期的末尾,参数服务器会与各计算设备进行通信以获取梯度,该过程受限于计算设备中迭代时间最长的设备,会出现拖累现象,影响模型的迭代时间。本文对传统模型并行流水化策略进行改进,将神经网络进行图抽象,对进行流水化模型并行的神经网络模型进行均匀拆分。通过对神经网络层的计算量和通信量进行建模,改进策略使用基于本地搜索的遗传算法对拆分结果进行择优,保证各代分割方案不与神经网络的执行顺序冲突。择优后的分割方案可令各模型分片所需计算时间较为平均,同时尽量减少了模型分片间的通信时间开销。与传统策略进行对比的结果表明,对于特定深度神经网络,本文提出的改进策略求解出的模型分割方案能够令同步流水线模型并行的迭代时间缩短5~19%,异步流水线模型并行的效率提高最多15%,同时可减少最高35%的网络通信。本文针对设备性能不均衡导致同步数据并行迭代时间增长的问题,提出了基于设备性能差异的混合并行策略。该策略使用分组混合并行,在组间使用同步数据并行,组内使用流水化模型并行,通过在组内依据计算设备性能分配模型分片减小低性能设备对迭代时间的影响。策略依据设备计算能力进行组内流水并行的模型分割,有效提高组内模型并行的效率,减少了迭代时间;通过缩小组间迭代时间差距,减少训练同步阶段的等待时间。实验结果表明,本文提出的混合并行策略相比单纯同步数据并行策略,在计算设备性能存在差异的情况下可将全局迭代时间平均缩短约21%。
其他文献
遥感图像的语义分割是遥感图像处理中的一种重要方法,它能为后续的图像识别和场景理解提供必要的基础。遥感图像分辨率大且场景比较复杂、目标尺寸差异大和存在易混淆的物体,这些都会给分割的任务带来更多的挑战。针对上述的这些问题,本文的主要研究内容如下:(1)提出了基于多尺度自适应权重信息流融合算法(MWFNet)用于遥感图像语义分割。为了解决遥感图像的目标多样性和尺寸差异大的问题。提出多尺度编码模块,使用5
在现代战争中,军用飞机扮演着越来越重要的角色。面对严峻的防空环境,作为博弈的一种有效手段,飞机突防技术也趋向于综合化、复杂化和智能化,突防难度越来越高。设计优良的突防航路可以有效缩短航路长度,提高突防成功概率,为作战任务的成功实施提供保障。因此,对突防航路规划技术的研究需求变得越来越迫切。本文针对复杂防空环境下的突防航路规划问题,通过分析不同典型威胁源的特性并建模,生成威胁数字灰度地图。根据飞机进
随着三维点云技术的发展,人们不再满足于二维平面图像,开始向三维领域发展。深度相机可以从场景中获取三维信息,因此被广泛应用于需要更可靠三维信息的人机交互(HCI)和增强现实(AR)。由于深度相机由于其精度的提高并且变得更加便宜和流行,以至于可以部署在智能手机上,研究人员开始积极研究利用深度信息的三维计算机视觉。与深度相机拍摄的深度图像(称为2.5D信息)相比,研究人员试图将深度图像转换为三维点云或通
语义分割是计算机视觉领域的重点关注问题,也是场景理解的基石性任务。近年来,深度学习在图像处理、语音识别等领域表现优异,因此语义分割任务也更倾向于采纳深度学习方法,来实现更精准的分割预测。目前,最出色的语义分割方法往往借助全卷积神经网络的结构形式,以此来获取逐像素的分类预测。然而,语义分割是一项密集标注任务,需要在获得目标语义信息的同时对其进行精确定位。而现有的神经网络模型往往会在提取特征的过程中损
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。聚类算法是一种高效的无监督学习方法,被广泛应用于许多领域,包括机器学习,数据挖掘、模式识别、图像分析和生物信息学等。但是已有的聚类算法仍存在一些难点问题,例如复杂数据集中存在的簇间密度不均匀、聚类形态多样、聚类中心的识别等。针对这些问题,本文设计研究了相应的聚类算法以改进现存的问题,提高聚类算法的性能。具体研究内容如下:(1)针对
自Heusler合金问世以来的一百多年时间里,由于大量具有各种物理特性的新型Heusler合金材料不断被发现、制备并广泛应用,使得对于新型Heusler功能材料的设计与合成至今依旧是材料科学领域的热点研究方向之一。我们使用基于密度泛函理论的第一性原理计算的方法对原子替换所得的Ag基Heusler合金材料进行了高通量计算,得到了多种稳定的新型Heusler合金结构。文中系统的讨论了这几种新结构的稳定
硅元素及其化合物在现代工业中起着不可或缺的作用,现已经被广泛应用到了各个相关领域中。本文采用原子掺杂的方法,寻找新型的硅同素异形体和硅化物结构,并结合第一性原理计算方法研究了新结构在常压下的力学性质、弹性各向异性、电子结构等性质,同时还分析了能带变化的影响因素,为有效合成该材料提供理论基础,也为其他新材料的理论研究提供支撑。本文研究的主要内容如下:1.对G21、G58、G90、G117、G158、
随着科技的快速发展,功能材料已经广泛应用于现代工业的各个领域之中,新型功能材料的结构设计与合成是目前材料科学的研究热点之一。本文采用基于CALYPSO的晶体结构设计技术,首先结合只限定原子数的直接搜索方法,发现了一个具有直接带隙的新型大胞超硬碳晶体结构Fmmm-C80。然后采用功能材料反向搜索方法,在使用CALYPSO搜索晶体结构的过程中,设定带隙为每一代结构中的二次筛选目标参数,最终发现了一个新
传统的密码系统假设攻击者只能访问密码算法的输入和输出,即密码算法处在一种黑盒模型下。但随着计算机与互联网技术的高速发展,攻击者的能力得到了显著提高,传统的黑盒模型已经无法满足密码算法安全性分析的需要。2002年,Chow等人根据数字版权管理(Digital Rights Management,简称DRM)应用场景,提出白盒攻击环境(White-Box Attack Context,简称WBAC)的
低序级断层延伸短,断距小,识别解释有一定的困难,但低序级断层是局部微幅度构造和油气富集的主控因素,能否识别低序级断层和微幅度构造直接影响致密储层水平井部署,轨迹控制和砂岩钻遇率。本文首先基于多窗口倾角扫描的曲率属性,凸显低序级断层的特征;然后采用属性定量优化方法,即结合地震剖面,平剖结合统计不同断距断层的曲率值,以此设定门槛值,消除非断裂地质效应,突出目标低序级断层和微幅度构造的平面剖面特征,提高