面向分布式机器学习系统的参数通信调优研究

被引量 : 0次 | 上传用户:chenyuanliang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习特别是深度学习,是人工智能领域的重要研究内容,人工智能应用正在得到飞速发展,例如自动驾驶、人脸识别等。然而,随着机器学习数据集以及深度学习模型规模的不断增加,单机通常需要几周甚至更久来训练机器学习模型。为了适应大数据时代的挑战,需要将传统机器学习分布式化,在多个节点上分散工作量,以加快机器学习的训练速度。当前,参数服务器系统是大部分分布式机器学习系统的实现方式。当使用参数服务器训练分布式机器学习模型时,节点之间需要通过通信来保证模型一致性。传统的分布式机器学习参数通信模型是整体同步并行通信模型(Bulk Synchronous Parallel),该模型使用了同步屏障,工作节点到达同步屏障之后就会暂停训练,直到所有的工作节点都到达同步屏障后进行一次全局同步。这种模型使得训练最慢的工作节点会拖累整个集群的计算效率。异步并行模型(Asynchronous Parallel)和延迟同步并行模型(Asynchronous Parallel)解决了整体同步并行模型中存在的问题。异步并行模型中各个节点不进行同步,使集群性能被充分使用,但这过度利用了机器学习的有限容错性,最终会导致模型精度较差。延迟同步并行模型中训练最快的工作节点和训练最慢的工作节点之间的最大迭代差被延迟阈值限制,然而延迟同步并行模型也未完全考虑真实集群环境中的各种不确定因素,不能适应真实集群环境。针对分布式机器学习主流参数通信模型中存在的问题,本文提出了高效同步并行模型(Efficient Synchronous Parallel)和预测同步并行模型(Predicted Synchronous Parallel),然后,本文实现了分布式机器学习框架Kanel,并且在Kanel上完成了高效同步并行模型和预测同步并行模型的实现。本文研究内容如下:(1)本文对当前主流分布式机器学习模型参数通信模型存在的问题进行分析,并提出了一种新的分布式通信模型,名为高效同步并行模型。该模型从优化参数服务器和工作节点之间通信时间出发,对通信时延进行了优化。该模型使工作节点有判别此次和参数服务器的通信是否高效的能力,如果工作节点判定此次模型交换是高效的,那么工作节点就会进行模型交换,否则工作节点就会放弃通信直接进行下一轮本地训练。对高效同步并行模型进行策略设计与算法实现后,在理论上对其进行了证明,验证了高效同步并行模型具有与整体同步并行模型相同的收敛性,能确保模型的最终收敛。最后,本文对高效同步并行模型进行实验,实验结果表明高效同步并行模型有着更好的性能。(2)针对延迟同步并行模型在真实计算集群中出现的问题,提出了预测同步并行模型。预测同步并行模型通过上一轮迭代各个工作节点的训练耗时计算出各个工作节点的性能从而预测出下一轮迭代集群训练情况并从中找到最优同步时机使得节点同步等待时间最短。为了进一步提升工作节点的计算效率,在预测同步并行模型中,快节点在进行同步等待时,也会使用本地模型和本地数据集进行机器学习训练,直到接收到新的全局模型参数。本文对预测同步并行模型的设计与实现进行论述,并证明了其具有与整体同步并行模型相同的收敛性。对预测同步并行进行实验,实验证明预测同步并行模型在保证模型收敛的前提下能加速机器学习训练。
其他文献
2020年新冠肺炎疫情席卷全球,“双循环”新格局推动“一带一路”倡议进入新的发展阶段。在疫情影响下,各国纷纷重视自然环境保护和可持续发展。“一带一路”倡议作为国际合作交流平台,更应该重视环境风险的识别与治理。本文构建环境风险评估指标体系,采用因子分析和聚类分析方法,对“一带一路”沿线六大经济走廊63个样本国家的环境风险类型进行实证分析。研究结果表明:(1)能源依赖程度、环境友好水平、生态可持续性、
期刊
数学符号是“用数学的语言表达现实世界”的方式之一.符号意识与抽象能力相辅相成,是数学表达和进行数学思考的重要形式,只有学生将现实生活抽象成数学符号,并能理解符号的使用时,才能准确地进行数学表达.理解符号、会运用符号才能提高抽象能力,进而提高运算能力和推理能力.文章有意识、有方向地利用教材中的素材,培养学生的符号意识.
期刊
作为高中语文教学中的重要组成部分,阅读和写作时常紧密相连,阅读可以为写作积累素材资源、丰富语言,而写作也可为阅读创造条件、积累经验,二者可谓相辅相成、密不可分。在高中语文大单元整合教学中实施读写一体,不仅可以丰富学生的学习体验,提升学生的阅读水平和写作能力,同时还可以提升学生的语文核心素养和综合素质。基于此,分析了读写一体在高中语文大单元整合教学中的重要性,探讨了基于读写一体的高中语文大单元整合教
期刊
随着新课标的推行,科学进行教学设计、推进化学课堂改革是当前初中化学教师重点研究的话题。科学的教学设计需要遵循初中生的认知规律,调动学生的主动参与意识,促进学生化学核心素养的形成。以初中化学氧气的实验室制取教学为例,具体分析了基于认知规律的初中化学课堂教学设计的优化策略,如创设课堂情境、组织交流合作、进行实践操作、归纳整理化学现象、开展真题演练、采用多元评价等。
期刊
文章以人的发展立场审视人工智能教育应用的伦理问题,揭示出人工智能对人的想象力遮蔽的风险,并探讨未来教育的可能路径。文章采用文献研究和逻辑推理方法,指出想象力是人异于人工智能的重要能力,释放师生的想象是教育伦理的第一原则。以想象力为切入点,指出人工智能所形塑的虚拟景观、他者叙事、算法锁定和主奴互动遮蔽了人的真实体验、自我省思、意义生成、生命实践等,引发人的想象力退化的伦理风险。文章认为,人的想象是防
期刊
独立意识的培养不仅能使幼儿更加积极地投入到自我学习与自我成长的过程中,还能使之养成良好的行为习惯,在此后的学习和生活中取得更加优秀的成绩。作为一名有着丰富育儿经验的幼儿教师,笔者认为,想要培养幼儿的独立意识,我们就必须在生活上培养幼儿的独立意识,在学习上培养幼儿的独立意识以及在人际交往上培养幼儿的独立意识。
期刊
在五千年的历史长河中,中华民族创造了深远而悠久的历史文化,我们每个人都肩负着继承和弘扬中华民族优秀传统文化的责任。为了更好地弘扬与发展中华民族优秀传统文化,教师应该着重培养学生的爱国主义情怀和继承弘扬优秀传统文化的意识。生物学科是中学生教育过程中重要的课程之一,在中学生物教学中渗透中华民族优秀传统文化,有利于提高学生学习生物学科的兴趣,从而促进学生的发展。
期刊
近年来,随着信息技术在教育教学中的普及,大部分教师开始适用课件教学模式,而传统存储模式下,教师适用U盘或移动硬盘等传统存储设备很容易受到病毒感染,导致学校大量电脑终端感染病毒,以致影响正常教学工作的开展,同时也给校园网络安全带来比较严重的安全隐患。因此,针对上述分析,以陕西邮电职业技术学院(以下简称陕邮职院)为例,针对学院实际情况,通过开发云存储网盘系统的方式,充分利用私有云存储存模式对传统存储模
期刊
随着互联网技术的不断发展和普及,如今电子数据犯罪案例的数量也在快速增长。在云计算技术得到普及应用后,此种情况越加严重,甚至很多用于云端存储的网盘也成了不法分子违法信息的藏匿空间。针对此种情况,本文将以百度网盘客户端为例,基于Windows操作系统来提出一种网盘客户端取证方法,以期能够为使用者提供理论参考。
期刊
随着信息化的快速发展,企业已经越来越离不开各种信息系统,信息系统可以简化操作,提高工作效率,但是信息系统给企业工作带来便捷的同时,信息系统涉及到的操作隐患也不容忽视。信息系统的访问日志中包含了用户大量的操作信息,日志审计系统通过对日志中用户操作数据的提取,将日志转换为审计信息数据,能够反映信息系统的应用情况。但是审计信息的安全性同样值得注意,被篡改的审计信息无法真实反映信息系统的应用情况。区块链技
学位