基于GPU的深度神经网络模型并行及优化方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fenfeixueer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,深度神经网络在图像处理、语音识别和自然语言处理领域发挥着极其重要的作用,然而由于学习的数据量庞大,直接导致实验过程中模型的学习速度很慢。过去,一般会通过增加机器数量来实现快速学习。如今,随着图形处理器(Graphics Processing Unit,GPU)的内存和计算能力的提升,越来越多的用到GPU进行计算。但是模型的增大又受到单个GPU内存太小的限制,经常因为更大的模型在GPU上无法储存,致使在单GPU上不能训练拥有较多参数的神经网络。针对当前深度神经网络模型训练效率低下的问题,提出了在深度神经网络学习的过程中采用多GPU上模型并行训练的方法。为了优化模型并行训练,提高模型训练速度,从以下三个方面进行了优化。要实现深度神经网络模型的并行计算,首先要将一个计算模型拆分成两个模型分片分别存储在两个GPU上,使两个模型能够在两个GPU上并行计算;优化模型并行计算的顺序,在深度神经网络模型训练的过程中,不同的地方使用不同的并行方案,在深度神经网络的卷积层中使用数据并行,而在全连接层中使用模型并行;再次优化模型在训练过程中访存读取数据的性能,在模型并行结构中加入一个数据转化层来实现GPU上的数据整合或者交换;最后针对训练数据集太大的问题我们使用Mini-batch并行训练的方法来优化数据处理。采用多GPU加速深度神经网络的模型并行优化设计方案,同时结合在模型并行训练中对数据的并行处理,从而实现了对深度神经网络模型并行训练的加速。在Linux操作系统以及CUDA的编程环境下,实验主要使用MNIST、CIFAR10、以及CAR数据集对算法进行了对比测试,实验结果表明,采用多GPU的模型并行训练方法与caffe的方法相比,在训练准确率相当的前提下,训练的效率提高了20%至30%,深度学习方法的损失也较之小;最后,深度神经网络模型并行训练的方法最终也成功的应用到了车型识别的系统之中。
其他文献
目的:研究拉雅松和细叶云南松松针挥发油的化学成分。方法:采用水蒸汽蒸馏法从拉雅松和细叶云南松松针中提取挥发油,利用气相色谱-质谱联用技术分析挥发油的化学成分。结果:
目的:探讨慢性丙型肝炎中医证型的分布特点及其与血清瘦素、胰岛素抵抗的相关性。方法:筛选慢性丙型肝炎患者160例,归纳其中医证型,分别测定其血清瘦素水平、空腹血糖及胰岛
<正>1我国养老现状及存在问题随着人口老龄化的加剧和传统家庭养老服务功能日益弱化,养老成为重要的社会问题。截止2015年,我国60岁以上老年人数量已超过2亿,占总人口的15.5%
会议
展望未来,《国家集成电路产业发展推进纲要》明确提出,到2020年,我国集成电路产业与国际先进水平的差距逐步缩小,全行业销售收入年均增速超过20%,企业可持续发展能力大幅增强
顶岗支教实习是高校实习改革的一个积极探索,而高师生在实习中建立的师生关系是否和谐直接关系到中小学学生的心理健康和全面发展、关系到教育实习的效果、关系到顶岗支教实
目的:观察芪榆油膏对肛瘘术后创面肉芽组织中血管内皮生长因子(VEGF)mRNA表达的影响,以初步探讨其作用机制。方法:90例术后创面纵径在2.5~3.0 cm、术后伤口深度达外括约肌浅部
<正>冰心访问纪要一、1957年12月12日整理的访问纪要,访问者冯宜英。由文联工作谈起。建议文联多组织一些老作家艺术家到山区和农村去下马观花,时间稍长些,下去参加一定的工
苏轼的人生哲学受到后人的推崇,这种人生哲学的形成与道家思想有密切关系。苏轼道家思想的心路历程主要体现在其人性的回归、与道的自我融合、走向逍遥三方面。
滥用诉权属于"权利滥用"范畴,即"当事人"通过行使"诉权"达到非法目的,既侵害了国家法律和审判权,又浪费了审判资源,并剥夺了他人合法利用诉讼的机会。为保护当事人行使诉权,
网络技术的深入发展与中国社会转型期的历史阶段在时空上的耦合,导致虚拟的网络空间成为一个崭新的社会场域。网络营造了更加开放的话语环境,提供了更加多样的话语渠道,为公