分布式机器学习算法收敛敏感性优化技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:dangerererer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人类来到了大数据时代,为缓解单机机器学习训练对庞大训练数据的乏力,分布式机器学习应运而生,分布式机器学习在应对复杂数据、模型准确率提升、应用领域的扩展等方面具有良好的效果。而目前,主流的分布式机器学习框架可分为数据并行和模型并行以及混合并行几类,在数据并行领域中参数服务器技术是一大热门研究。参数服务器负责全局模型聚合、更新全局模型以及通信任务,计算节点则负责机器学习模型的训练。在训练过程中,参数服务器中的模型聚合策略和计算节点中的训练算法是影响全局模型准确率的重要因素。分布式机器学习中,模型的收敛敏感性直接影响了模型训练的收敛速度和训练精度。在计算节点中,以随机梯度下降法为代表的随机优化算法存在训练早期收敛震荡幅度较大的现象,降低了收敛过程中模型的收敛敏感性,使得模型训练的收敛速度存在提升空间。利用分布式计算环境中子模型较多的特点,可利用其他子模型来降低收敛过程中的震荡幅度,从而提升收敛效率。在参数服务器中,模型聚合策略会间接地影响算法收敛敏感性。在模型聚合的计算过程中,子模型在全局模型中的梯度贡献度应具有差异,使全局模型能够尽量多地吸收不同子模型的数据特征。数据并行领域中常用的模型平均法聚合策略采用子模型全平均的方式来计算全局模型,模型平均法的聚合过程忽略了子模型对全局模型梯度贡献度的差异,降低了收敛敏感性,从而导致了收敛效率和训练精度降低。针对以上问题,本文研究了分布式机器学习的训练算法和模型聚合策略,面向训练算法和模型聚合分别提出了并行随机梯度下降方向重排算法和加权平均模型聚合策略,并根据这两个创新点实现了分布式机器学习框架Paradise。本文的研究内容主要有以下几个部分:(1)分析随机梯度下降法的收敛过程中梯度震荡对收敛敏感性的影响,并定义震荡幅度作为指标来量化影响程度。利用分布式计算环境中其他不同梯度的子模型来调整本节点内子模型的梯度下降方向,从而可以使全局模型的下降方向更靠近全局最优的方向,改善模型的收敛敏感性。基于此思路,本文提出了并行随机梯度下降方向重排算法,能够有效改善模型的收敛敏感性,提高模型的收敛速度,并通过理论对其收敛性进行了证明。(2)对主流分布式机器学习框架中常用的模型平均法聚合策略进行分析,针对策略中子模型梯度贡献度相同的问题,在模型平均法上作出改进,提出了梯度重要性感知评价模型以利用子模型梯度重要性的不同来对全局模型的梯度贡献度差异化。基于梯度重要性感知评价模型提出加权平均模型聚合策略,以梯度重要性感知评价模型的输出指标作为权重进行加权模型聚合,实现能够对子模型在全局模型中梯度贡献的差异化,提高了模型的收敛敏感性,从而提高了收敛效率和训练精度。(3)基于并行随机梯度下降方向重排算法和加权平均模型聚合策略实现了面向数据并行的分布式机器学习框架Paradise。并在Paradise中对上述创新点进行了实验验证,实验结果验证了本文提出的训练算法和模型聚合策略可有效改善模型的收敛敏感性。
其他文献
无线室内分布式网络在室内位置服务、智慧城市等领域得到了广泛应用。无线时钟同步技术是无线网络完成目标定位、数据聚合等任务的支撑性技术。随着网络部署区域更加广阔与任务更加复杂,对无线网络时钟同步性能要求越来越高。目前主流无线时钟同步技术难以在同步精度、拓展性等方面满足日益严苛的需求。针对这个问题,本文提出了基于超宽带通信技术UWB(Ultra-wide Band)的距离感知无线时钟同步算法DAS(Di
中国经济融入全球一体化,企业之间竞争日益激烈,人力资源则逐渐成为企业的核心竞争力之一。如何正确地展开企业中层管理人员的培训,是企业稳定发展的一个重要基础。KY公司是陕西省一家大型公司,为打破各分公司独立的员工培训系统,打造独具特色的企业培训品牌,公司在2017年成立了企业大学---思创学院,该学院主要是培养公司的中坚力量,同时也承接少量的社会化的培训。截止目前思创学院共招收4期本公司学员和1期对外
四旋翼无人机因其结构简单、成本低、灵活起降等优点,越来越广泛的应用于各个行业领域,比如电力巡检、农业植保、环境监测等。为了降低飞行器对气流、风阻力等外界干扰的敏感性,减少由电机故障带来的安全隐患,实现四旋翼无人机系统的可靠、安全控制,本文针对系统存在外部扰动、执行器故障的情况,设计了一系列容错控制方案,具体研究工作如下:首先,针对四旋翼无人机系统的非线性模型,考虑外界干扰以及执行器偏差故障,利用滑
近年来,随着空间信息网络的不断发展,它的架构体系也越来越多变,网络规模也越来越大,因此需要进行更多低成本、灵活、高保真的实验对提出的各种理论研究进行验证。但是由于真实空间实验的高费用、高风险的特点,难以建立大规模的真实空间节点的试验台。因此,通过仿真平台来进行测试和验证空间信息网络的性能显得至关重要。本实验室搭建了一个面向空间信息网络的半实物仿真平台,能够真实地模拟链路、节点、拓扑等特性。但是该仿
氢能在交通运输领域具有广阔的应用前景.在轨道交通领域,中车四方股份公司已经成功开发世界第一辆氢燃料电池有轨电池并准备在世界上首次进行示范运行.本文总结了国内外氢能
树轮作为过去气候变化研究的代用指标已被广泛应用。当前的研究呈现多种树轮指标(宽度、稳定同位素、密度等)、多维气候因子(气温、降水、相对湿度、热量指数、ENSO、SPEI、sc P
医学图像的准确分割是计算机辅助诊断和感兴趣目标定量分析的关键环节。受成像机理限制,医学图像往往具有模糊、灰度不均匀、弱边界等特点,使医学图像的准确分割成为具有挑战性的问题。模糊连接度是基于模糊集理论的图像分割算法。该算法通过计算邻近度函数和亲和度函数来表达像素之间的连续性和相似性,从而实现对象的定义。由于模糊连接度同时考虑了图像的灰度特征和空间特征,因此在处理模糊图像时能得到理想的分割效果。本文在
与传统图像识别任务不同,细粒度图像识别目的在于区分同一个物种下的不同子类别,由于其类间差异小、类内差异大的特性,细粒度图像识别成为计算机视觉领域一项极具挑战的研究课题。同时由于其在实际生活中的广泛应用,例如生态保护、无人超市商品识别、车辆识别等,细粒度图像识别技术逐渐成为大数据智能时代诸多领域中的关键技术,具有无可限量的价值,也是近年来计算机视觉、模式识别等领域的研究热点。在众多模型方法中,不使用
良好的资源禀赋状况是经济增长的基础,自然资源作为基础性生产要素,在区域经济发展中发挥着不可或缺的作用。延边蕴藏着丰富的自然资源,经济发展迅速,近年来取得了显著的成绩。因此本论文主要研究延边自然资源禀赋与经济增长之间的关系。本文利用文献和理论归纳了自然资源禀赋与经济增长之间的关系,通过实证分析旨在寻求延边自然资源禀赋与经济增长之间更为准确的关系。使用向量自回归(VAR)模型,运用格兰杰因果关系检验法
根据刘维尔意义下完全可积性的定义,一个哈密顿系统如果有足够的且满足相应条件的守恒积分,那么这个哈密顿系统在刘维尔意义下就是完全可积的.在可积的基础上,还可以进一步研究此哈密顿系统的超可积性.因此,哈密顿系统的守恒积分是研究其可积性和超可积性的关键,而如何构造哈密顿系统的守恒积分也是至关重要的.目前,关于哈密顿系统可积性的研究大都基于常曲率空间或零曲率空间,但变曲率空间却是更常见的空间,所以变曲率空