面向边缘端的混合分布式深度学习训练策略研究

被引量 : 0次 | 上传用户:myna5726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习已经被广泛应用于图像处理、语音识别、自然语言处理等领域。然而,随着深度学习方法对训练速度和数据处理能力的要求愈来愈高,传统的基于单机的训练方法已经无法满足需求。因此,分布式深度学习训练方法成为了提高计算能力的有效途径,尤其是在需要处理大规模数据的场景下。这种方法能够通过在多台机器上并行训练深度学习模型,以加快训练速度并提高模型的准确性。同时,大规模分布式物联网(Io T)应用的兴起催生了深度神经网络(DNN)等网络模型在边缘端训练和推理的蓬勃需求。受限于中心式的数据传输机制、边缘端设备的异构性和资源受限等问题,现有单一的数据并行、模型并行的分布式训练机制往往不能充分利用边缘设备算力、网络拓扑结构及带宽资源等,甚至无法直接应用于边缘端。边缘端的分布式训练模式对计算资源、训练网络的划分合理性和数据分布质量有着较高的要求。利用边缘端设备算力和I/O能力,构建分布式训练是研究的热点之一。为此,本课题围绕边缘分布式训练的上述问题,对资源受限、环境动态和数据不均场景下的分布式训练相关技术开展研究,主要工作如下:(1)本课题提出了边缘端混合分布式训练框Edge Mesh,它基于Tensor Flow和MeshTensor Flow,是一个面向较大规模的,有着广泛适应性的边缘端分布式训练框架。Edge Mesh将数据并行和模型并行两种模式进行了融合,对卷积层运算和参数传递有着细粒度的控制,是一种多设备间模型并行的参数服务器架构;该框架对多个模型并行节点组成的集群间加入了参数服务器,从而在保证模型精度不受影响的前提下,不仅解决了边缘设备上DNN训练的资源受限性问题,同时也加速模型训练过程。实验表明,相比单机训练和数据并行模式,边缘端混合分布式训练框Edge Mesh在保证等效模型精度情况下,显著降低了平均内存消耗。(2)本课题提出了边缘端混合训练网格自适应策略和模型并行卷积过滤器划分算法,用于加速边缘端混合分布式训练。边缘端混合训练网格依照边缘设备浮点计算能力的差异,划分出一个适应混合分布式训练框架的布局,从而降低由集群间性能差异所导致的训练时延大的问题。模型并行卷积过滤器划分算法是一种考虑了运行环境带宽、设备浮点算力、内存和网络时延的模型并行动态负载均衡算法,旨在划分出适应当前边缘环境的卷积过滤器,较少同步等待时延。将边缘端网格自适应策略和模型并行卷积过滤器划分算法部署于边缘端混合分布式训练框Edge Mesh,相较于基准算法,Het-Edge Mesh不仅有效降低了异构边缘设备上训练时延,加速了DNN模型训练过程,同时又有较高的扩展性。实验表明,与单机训练和数据并行模式相比,Edge Mesh分布式训练机制可以在保持模型准确性的同时,将平均延迟减少3.2倍,平均内存开销最高减少43%。
其他文献
通常要进行三维场景的构建需要真实环境的支持,室内环境的三维场景重建一般由激光雷达或视觉传感器完成,由于激光雷达成本高花费大,重建出来的结果缺少彩色信息,因此选用视觉传感器和SLAM系统,然而SLAM系统重建出来的地图依然是稀疏的场景地图,跟进工作无法继续。为了解决上述问题,本文主要利用多源传感器(深度传感器和IMU惯性传感器)融合的室内环境稠密三维重构方法,从而补充了缺失的室内环境数据,保证了正常
学位
随着现代医学模式的转变和人们对健康概念的更新,人们也越来越关注口腔健康和口腔美观,如何快速培养合格的年轻外科医生是一项非常紧迫的任务。因此,本文所开发的基于力反馈的口腔临床虚拟教学系统(Oral Clinical Virtual Teaching System,OCVTS)可以缩短口腔医生手术训练周期,有利于缓解现阶段口腔医生短缺的局面,为满足人们对美好生活的需要具备重要的现实意义。本文研究内容如
学位
随着第四次工业革命浪潮的到来,智能产品已经进入人们的视野。移动机器人是机器人的重要组成部分之一。在移动机器人所涉及的关键技术中,一个重要的问题是机器人导航。其中,在未知的复杂环境中,SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术在机器人工程中发挥着至关重要的作用。由于单个传感器只能检测到有限的信息,它们在智能产品中的应用仅限于发出简单
学位
时间序列数据反映了时间和事务两者之间的变化过程,挖掘隐藏在时序数据中的规律变得非常重要。本课题研究的主要目标就是寻找一种采用波形匹配算法,以解决在海量的时序数据中查找与某一段波形相匹配的数据段此类曲线搜索问题。本文主要研究工作如下:1)CNN提取曲线特征过于随机,而且要查找的曲线目标是临时给出的,并没有多余的训练样本。本文使用相关时序数据集作为训练样本,解决提取曲线特征过于随机的问题,使用孪生神经
学位
随着数字化技术与手术导航技术的快速发展,口腔植入引导技术已成为现代口腔种植导航及相关诊疗器械研究的重点。本文针对当前种植导航领域的热点问题,研究了基于多传感器融合的车针目标跟踪方案,采用基于灯塔激光的VR定位技术和相机光学定位技术,提出的融合方案包括预处理阶段、基于不同传感器的初步定位解算阶段、数据融合测试阶段。研究包括基于不同传感器定位的目标位姿解算模型和种植导航的误差控制、多传感器融合方案的实
学位
随着5G网络的兴起,制作一张具有丰富艺术风格的图像并分享在网络社交平台账号上变得越来越流行。风格迁移方法主要是对整幅图像添加风格化的纹理、颜色等处理。基于深度学习的风格迁移方法可以将不同的艺术图像应用在内容图像上,最终生成风格化图像,极大的增强了人们的视觉感官。但这些方法都有个问题,那就是在风格迁移过程中容易忽略原本图像的语义信息导致内容图像失真、变形。因此,本文提出了一种新的改进方法,该方法可以
学位
晶粒度是钢材性能的一个重要评判标准,在微观角度,钢材表面晶粒呈现类似于细胞组织切片的颗粒状分布图像,晶粒的面积、长度、以及单位面积内晶粒个数等特征都影响着钢材的强度、塑性和韧性等性质,而这些晶粒特征在金相检测中通过不同金相等级来反映。目前对于金相等级的评定,最常用的方法还是通过人工依靠经验评定,人工判定金相等级很大程度上取决于工人素质,不确定程度较大。本论文在数字图像处理以及深度学习技术的基础上,
学位
欠压密黄土是处于疏松状态水敏性十分强烈的天然Q3黄土,其物理、力学特性受含水率的变化影响较大,当欠压密黄土吸水饱和后可形成饱和软黄土,易导致工程灾害发生。目前对欠压密黄土失水后的土性变化和工程问题研究较多,但其在地下水位回升阶段,土体在有上覆荷载情况下含水率逐步增大过程中的强度演化特性研究还有待进一步深入。本文基于GDS三轴试验系统,以具有较大孔隙比的欠压密黄土为研究对象,开展了欠压密黄土在水-力
学位
近些年来,图像拼接技术成为了计算机视觉领域的一个研究热点。传统的图像拼接技术在面对弱纹理或无纹理的图像时,如林区、天空以及海面等场景,由于特征检测能力不足,从而会导致拼接效果不佳;在深度学习中,有监督的方法由于数据集的标记工作存在人工成本高,时间开销大等问题,导致该方法难以得到普及;而无监督的方法由于图像间的视差问题,在面对大视差的待拼接图像时,其拼接结果也往往不太理想。为了更好的对林区图像进行拼
学位
借助大数据分析手段,情报分析人员能够从表面上看似毫不相关的新闻事件中挖掘出潜在情报。然而要全面、及时地筛选与分析各类新闻需要耗费大量的时间和精力。因此,如何在短时间内获取能够清晰地传达新闻主题信息并且流畅易懂的摘要进行辅助阅读,已经成为目前急需解决的问题。Transformer模型在完成自动文本摘要生成任务时能够有效解决序列并行训练问题,提高了摘要生成的速度。但它并不擅长对主题信息进行编码,无法获
学位