深度神经网络上的通信优化算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:haojie831001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络成功应用于图像处理、机器翻译和语音识别等领域。面对日益增长的数据量,分布式训练深度神经网络模型是一个有效解决方案。但是在分布式训练中还存在若干问题。第一,在系统架构方面,目前主流架构是参数服务器架构,它没有根据深度神经网络不同层的特性对计算节点进行区分,造成通信开销过大。第二,在通信数据压缩方面,目前主流方法是梯度稀疏,该方法通信复杂度过高,并且稀疏后梯度值依然较大,增加了通信开销。针对当前深度神经网络在分布式训练下存在的不足,从系统架构和通信数据压缩两个方面,提出了Hourglass架构和Sparse Gradient Compression(稀疏梯度压缩算法),减少分布式训练深度神经网络的通信开销,加速训练过程,并保证精度损失在1%以内。在Hourglass中,将卷积(CONV)层和全连接(FC)层的计算分配给不同节点。集群中大多数节点用于计算CONV层,其余节点用于计算FC层。Hourglass能充分利用集群中各节点的计算能力,并且使FC层的参数和梯度在FC节点之间进行通信,而不是整个集群。Sparse Gradient Compression包括层次梯度稀疏、梯度量化和延时通信。这项技术具体包括:(1)层次梯度稀疏算法针对现有研究工作通信复杂度较高的问题,将通信复杂度降低到O(8)7)2)9))(n为计算节点数,m为每一字节大小消息所需传输时间)。(2)梯度量化算法将稀疏梯度量化为2-bit值。(3)延时通信算法使每个计算节点执行随机梯度下降算法的多次迭代来计算更多参数更新。实验结果显示,在CIFAR-10,ImageNet,PTB和LibriSpeech数据集上,分别进行了图像分类、语言模型和语音识别实验,证明了Hourglass架构和Sparse Gradient Compression的有效性。在多个数据集和深度神经网络模型下,相比于不同任务的当前最优结果,Hourglass架构和Sparse Gradient Compression在训练速度方面提升了约2至15倍,在通信数据压缩比方面提升了约2至8倍,同时保证精度损失在1%以内。
其他文献
随着我国步入老龄化社会,养老问题越来越得到社会的关注。2019年11月,中共中央、国务院印发《国家积极应对人口老龄化中长期规划》指出,老龄化是我国目前与将来比较长一段时
化学是一门研究物质性质及变化的学科,注重培养学生的化学素养、逻辑思维,有利于指导学生更好的认识世界。初中化学是培养学生化学基础知识和学习兴趣的关键时期。而化学实验
通过对08-16型捣固车在高速走行时的动力传递过程中液压回路的分析,及对该液压回路中所采用的主要元件结构的分析,得出液压驱动系统是实现养路机械高速走行和作业要求的低速
新课改的不断推进使英语教学越来越受到重视,发展学生英语核心素养成为教育界普遍关注的话题。教师在教学过程中不仅要重视学生基础知识与基本技能的掌握,更要重视学生语言能
【正】 敦煌艺术有明显的地方特色,蕴含着中国西北地区多民族的审美情趣,但其主体美学意识,是中印和佛道美学意识的体融。佛道美学意识,是中印古代美学意识的突出展示,都不同
深入分析并指出了多出口流量分配的需求和存在的问题。结合实际的应用背景,指出了传统IP路由的不足。提出了解决多出口流量分配问题的方法——IP策略路由(PolicyRouting)机制
当今社会科技发展迅速,消费者的需求也正向着多样化与个性化转变,外部的环境变化给企业的生存与发展带来严峻的考验。因此,企业必须具备高度的适应能力、敏锐的识别能力、迅速的反应能力以应对新环境下所产生的各种突发事件。近年来,苏宁易购发展势头迅猛,但是在其发展过程中,其财务管理工作还存在一定的不足急需解决。本文在阐述财务管理的含义、财务管理的目标、财务管理的原则基础上,介绍了财务管理的内容和财务管理的环境
作为上层网络业务的承载者,光纤通信网络必须不断提升网络容量、改进网络架构以应对日益增长的带宽需求和业务种类。网络容量的提升主要依靠更高的信号波特率,更高阶的调制格
针对现代生物医学所面临的日益严峻的慢性疾病防治挑战,以及"生物-心理-社会医学模式"等新医学模式所面临的"多因素非线性分析"的困惑,在对其进行复杂性科学理论分析与讨论的
美国作为高等教育强国,它有着当今世界最大的、最先进的高等教育体系,吸引着世界各地的优秀人才。它现有的繁荣,与其在20世纪80年代的改革是分不开的,指导改革展开的高等教育