基于深度学习的图像分类方法及加速训练技术

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xuelun2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展和智能手机等终端的普及,互联网上的图像数据呈现出指数级的增长趋势,这些图像涵盖了人类生活的各个方面,包含了大量的有用信息。图像分类是利用这些信息的重要手段,有利于解决现实场景中的很多问题,在图像检索、场景识别、人机交互等方面都有着广阔的应用前景。卷积神经网络凭借其优异的特征提取能力,被广泛应用于图像分类领域。由于现实任务场景越来越复杂,为了满足需求,网络模型的规模也在不断增大,导致训练一个深层网络非常耗时。因此如何设计高效的卷积神经网络以及如何加速神经网络的训练成为深度学习领域的重要研究课题。本文以图像分类为背景,选取典型的卷积神经网络DenseNet作为研究对象,对利用DenseNet进行图像分类的方法和分布式并行训练算法进行了研究。DenseNet通过特征复用的方式减少了模型的参数量,并且能取得很高的准确率,但是模型的可扩展性不高,而且频繁的特征图拼接操作也使模型在训练过程中占用了过多的显存。同步数据并行是最常使用的并行训练方法,在每个迭代过程中计算节点与参数服务器之间需要进行通信,以交换梯度值,当网络模型的参数规模较大或网络带宽受限时,通信时间容易成为瓶颈,极大地影响了模型的训练速度。本文首先针对DenseNet模型的缺点提出了改进策略,通过改变模型中特征复用的方式,降低了模型参数量,并基于改进后的模型设计了三种不同结构的卷积神经网络,分别在MNIST和CIFAR-10数据集上训练,取得了很高的准确率,实现了图像分类功能。实验结果表明,本文提出的改进策略能在取得相同准确率的前提下显著降低模型的参数,提高参数效率。其次,针对同步数据并行中的通信瓶颈问题,提出了一种基于梯度量化的优化算法。该算法通过逐层更新参数,将一部分计算时间和通信时间重叠;在计算节点向参数服务器上传梯度信息前,对梯度值进行量化和编码,减少通信的数据量;为了降低量化产生的梯度损失对模型收敛速度的影响,在各节点更新参数时加上量化误差,并且每经过几次迭代后将各节点参数进行平均。实验结果表明,相比于传统同步数据并行算法和SSP算法,本文的优化算法在保证准确率的前提下,可以有效提高模型的训练速度,缓解了分布式训练中的通信瓶颈问题。
其他文献
1临床资料患者因'尿毒症',于13年前给予股静脉置管行血液透析,每周3次,半月后行左侧前臂桡动脉与头静脉端端吻合内瘘成形术,术中顺利,术后血管闻及震颤,12天后拆线,
斯维亚托斯拉夫·里希特(Sviatoslav Richter,1915.3.20~1997.8.1)(亦译李赫特、李赫特尔),俄国钢琴家。父母均为键盘乐手。幼年随父习琴,开蒙后即完全依靠自学至成人。15
对铜冶炼厂烟囱烟气腐蚀的成因及防腐蚀烟囱结构形式和选材进行分析,并根据应用实践对烟囱重要部位防腐构造作了重点探讨。
根据气压沉箱结构施工顺序,分四种工况计算了沉箱从地面制作至下沉到位过程中结构的内力和变形,并总结了内力和变形的变化规律情况,区别于常规隔离体简化分析思路,采用有限单元法
现代人对羞愧的感觉已十分陌生,他们不能理解博尔赫斯的“愧对一切死亡”是这样一种内心感受:当看到周围的许多人陷于困境之中时,我却能够过着幸福的生活,这使我难以承受……
研究目的:探讨NFκB信号通路抑制剂ACT001在乳腺癌他莫昔芬耐药中的作用及机制。研究方法:选取MCF7、T47D以及ZR7530细胞系作为研究细胞。MTT法检测他莫昔芬、ACT001单药以及
比较了传统清洗技术与超分子优缺点,在莱钢HlG140/960-80-5.2/480 型余热锅炉大修投用前使用了中性超分子膜化技术,使用后提高了防腐性能,经济效益明显.
理解科学本质是科学素养的核心成分之一,也是科学教育的重要内容。作为增进学生科学本质认识的有效途径,化学课堂教学在科学教育目标的实现过程中起着极其重要的作用。本文通
X连锁鱼鳞病是临床常见的先天性皮肤疾病,腹部皮肤干燥、粗糙、过度角化并附着棕褐色鱼鳞状鳞屑,皮肤以外的常见表现有角膜混浊、隐睾症、性腺功能减退、房(室)间隔缺损、肾
叙述了安钢100 t 转炉二次除尘系统的工艺流程与组成结构特点,分析了该系统运行中出现的问题,进行了针对性的设备优化改造,取得了较好的经济与环保效果.