分布式随机梯度下降算法研究

来源 :电子科技大学 | 被引量 : 9次 | 上传用户:wangjuhui19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习在最近的几年里飞速发展,得到了越来越广泛的应用,在各个领域也取得了突出的成绩。随着大数据时代的到来,数据量成倍的增长,同时深度学习模型也越来越庞大,使用单台机器对深度学习模型进行训练已经不能够满足人们的需要。于是分布式深度学习成为了一个重要的研究方向,许多科研团队和科技公司从不同的研究角度对深度学习算法进行了改进,也总结出了很多关于分布式训练的经验和方法。但是本文在实际的训练过程中,发现存在以下问题:(1)现有的机器学习框架主要提供了通用的机器学习算法库,但是在某些特定问题上,例如卷积神经网络这类非凸优化问题,并没有做专门的优化。所以在分布式环境下训练神经网络时,往往达不到理想的加速效果,甚至不能够使模型达到有效的收敛。(2)在异构环境集群中,由于各个机器的性能存在差异,分布式随机梯度下降算法的稳定性和有效性都出现了严重的下降,实际运行的结果与预期的结果总是相差甚远。针对以上问题,本文提出了一种基于参数服务器架构的分布式异步随机梯度下降算法,该算法使用异步协议来同步各个工作节点的参数,改进了现有异步算法中的参数更新机制。实验结果表明,该算法在处理图像分类这类非凸优化问题上取得了很好的效果,并且解决了异步算法在分布式环境下模型不收敛的问题,同时还能达到与同步随机梯度下降算法相近的准确率,提高了集群中计算资源的使用率。本文对异构环境进行分析,发现高延迟的更新值对全局参数的影响是导致算法运行效率降低的主要原因。针对这一问题,本文提出了分布式延迟感知随机梯度下降算法,该算法为每一个更新值标注了延迟度,在计算新的全局参数的过程中,参数服务器能够获取各个更新值的延迟度,从而降低高延迟度的更新值对全局参数的影响。实验结果表明,本算法在各种异构环境下能够有着良好的稳定性。本文的实验部分,基于浏览器搭建了便捷的分布式实验环境,方便对算法进行验证和测试。算法实现使用JavaScript语言进行开发,通过修改MLitB框架源代码实现了参数服务器架构,并实现了本文提出的两种分布式随机梯度下降算法,最后对算法进行了测试,得出了本文的结论。
其他文献
优秀的建筑并不是仅凭建筑师的个人喜好而随心所欲地设计出来的,它应该与所处的环境紧密结合,能够赋予环境不同的内涵,并渲染出特定的环境氛围。如何在特定的环境中进行创造,
24名胃癌高发区受试者服用300mgl-脯氨酸后,尿中N-亚硝基脯酸(NRPO)排出量由本底期的3.3±1.2μg/d升至9.4±4.7μ/d(P<0.001)。与脯氨酸同时服用刺梨汁稀释液30ml(含VC75mg),受试者NPRO排出量显著下降至2.2±1.21μg/d)(P<0.001),并显著低于本底水平
外源性标记基因LacZ在大鼠血管平滑肌细胞中的表达朱小君,胡征,毕万里北京医科大学心血管基础研究所唐朝枢,周爱儒,汤健本实验将标记基因LacZ导入血管平滑肌细胞(VSMC),以观察外源基因在血管平滑
目的探讨青少年唇腭裂患者的自我意识心理特征,便于对其消极心理状态进行及时的、有针对性的心理干预。方法根据心理量表的编制流程和要求,自行设计出针对唇腭裂患者的专用心
刑事立案是我国启动刑事诉讼活动的第一道程序,是追究犯罪的必经环节,具有限制侦查启动、分流犯罪的功能。作为立案程序的主导机关,公安机关对大多数刑事案件立案侦查。然而
[摘 要] 产权理论是由美国新制度经济学派创立,主要研究资本主义制度下产权界定和交易的理论体系。本文简述产权的定义、功能界定和主要应用,以期更好地理解产权理论。  [关键词] 产权 价格信号 制度安排    一、产权的定义  西方学者对产权的定义主要有以下两种:阿尔钦认为“产权是一种通过社会强制实施的选择一种经济品使用的权利”。他是把产权作为一种规则来加以定义。而德姆塞茨认为“产权是界定人们如何受
第一章第一节中,我们总结了钯催化重氮化合物的插入反应的最新研究进展。根据反应的机理,该类反应可分为两大类:(1)简单的钯催化重氮参与的偶联反应;(2)钯催化重氮参与的串联反
金融是现代经济的核心,构建多层次、功能互补的金融中心,对促进区域经济协调发展具有积极和重要的意义。本文阐述了东北金融中心对东北经济的推动作用,并提出建设沈阳为东北
人红细胞摄入钇和铈的动力学和机理已经用等离子发射光谱(ICP)研究。实验结果表明,钇(Ⅲ)和铈(Ⅲ)以柠檬酸络阴离子的形式进入人红细胞。摄入过程服从零级动力学方程。稀土络阴离子的摄