多GPU环境下的卷积神经网络并行算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zx1112220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的不断发展,卷积神经网络凭借其优异的识别性能,在图像识别等领域受到了越来越多的关注。由于神经网络模型通常包含大量参数,训练一个可用的卷积神经网络非常耗时。因此如何加速神经网络模型的训练过程,是深度学习领域的一个重要研究课题。为了解决该问题,通常采用多GPU并行的方式。多GPU并行加速训练过程的思路主要分为模型并行和数据并行。基于模型并行的算法难以达到负载均衡,加速性能相对较差;基于数据并行的算法中,目前的并行结构都存在无法均匀分配更新任务的问题,难以充分利用计算资源。针对上述问题,在调研了现有的多GPU并行算法的基础上,本文借鉴了异步随机梯度下降算法中延时更新的思想,提出一种基于环形结构的数据并行方案,该方案可以进一步提高多GPU的并行效率。本文的主要工作如下::1)分析卷积神经网络的隐藏层结构。使用随机梯度下降算法进行模型训练,并在此基础上,推导出卷积层、下采样层和全连接层中可训练参数的计算公式,为后续的并行算法设计以及代码实现做准备。2)给出了基于环形结构的数据并行方案。比较模型并行和数据并行的特点后,为了具备更好的可扩展性,进一步研究数据并行。针对现有数据并行方案中,无法均匀分配更新任务的问题,提出一种以环形结构组织GPU节点的方案。该方案中每个GPU都需要训练和更新模型,计算任务被均匀划分。最后从理论上分析了该方案的并行性能。3)在多GPU上实现卷积神经网络。根据卷积神经网络模型的训练公式,实现单GPU版本的代码,并选择合适的模型参数初始化方案。在此基础上,通过设置恰当的同步方案,以环形结构组织GPU间的数据传输,实现数据并行。此外,每个GPU将创建两个线程分别负责计算和传输,实现任务的并行,达到使用计算掩盖传输的效果。4)对基于环形结构的数据并行方案进行实验与分析。在MNIST和CIFAR-10数据集上,使用基于环形结构的并行方案训练卷积神经网络。当GPU个数为4时,分别取得了3.77和3.79倍的加速比。此外还与使用同步主从结构、归约树结构来训练神经网络的结果作对比,表明本文提出的方法具有更好的并行加速效果。
其他文献
(2017年11月7日)党的十九大不久前胜利闭幕了,这是我们党在全面建成小康社会决胜阶段、中国特色社会主义进入新时代的关键时期召开的一次十分重要的大会,是一次在新的历史起点
《苦行记》是马克·吐温的代表作之一,这部作品黑色幽默背后所隐含的是对社会欺骗实质的揭露,从中我们可以看到当时美国社会的那种尔虞我诈以及互相倾轧等丑陋现象。马克·吐
性侵案件屡见报端吸引眼球,但事实上来自社会和家庭的有色眼镜才是对孩子的最大伤害,这也是为什么家长一定要讨个说法的根源所在。河北省妇女王某某到全国妇联上访,反映其女
新课程改革背景下,其教学理念与传统的被动式灌输、机械式训练等教学方式有着明显不同,注重的是学生课堂参与的积极性,以及团队合作、交流沟通的能力。本文采用实验教学法,对
<正>1869年,《自然》杂志在英国创刊,现已成为世界上历史最悠久、最有名望的顶级学术刊物之一。自创刊近150年以来,《自然》始终如一地报道全球自然科学领域中最重大、最前沿
结合赊销风险的特征,提出将"赊销风险度"作为新的赊销风险度量标准,在定义赊销风险度的基础上,将企业赊销风险划分为5个等级,并将支持向量机(SVM)引入赊销风险评价,建立了基
<正>荣誉公证:《台北人》入选20世纪中文小说100强,位列第七位,是仍在世作家的最高作品排名。作者简介:白先勇,中国台湾旅美文学家。1937年7月11日出生于广西省桂林市临桂县
近年来,江苏省各级妇联围绕在网络虚拟空间开展妇女工作、建立网络妇联组织进行了积极的探索和尝试,目前省级和市级网络妇联共有16个,妇联组织的服务力、凝聚力和影响力进一
"音乐教育除了非常注重道德和社会目的以外,必须把美的东西作为自己的目的来探究,把人教育成真和善的"。通过不同的教育手段和音乐特殊的表达方式,把受教育者培养成为永远追
一、注重统筹推进,加强全面指导省妇联高度重视统计工作。每年专题安排部署全国妇联系统统计年报工作,将统计任务层层分解,明确工作进度和时间节点,要求省、市、县三级责任到