基于随机梯度稀疏优化的神经网络剪枝方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:wangjiejin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在机器学习与计算机视觉领域取得了巨大成功,如图像分类、语义分割、目标跟踪、对象检测等领域。由于巨大的存储占用以及计算开销,使得卷积神经网络在移动端的应用受到严重限制。网络压缩逐渐成为热门领域,许多研究人员提出了很多有效的压缩方法,如低秩分解、量化、网络剪枝、知识蒸馏等。本文为了压缩与加速卷积神经网络,提出了三种网络压缩方法,主要工作与贡献如下:1.提出了基于随机梯度稀疏优化的通道剪枝算法对于参数规模巨大的卷积神经网络,网络剪枝是较为直接有效的压缩方法,本文提出了利用随机梯度稀疏优化算法进行网络的参数更新,在训练过程中采用硬阈值算法计算通道权重的L1范数,并利用软剪枝将范数值较小的通道权重赋0,最终在训练结束时对网络进行硬剪枝,便可以得到一个性能与原始网络性能相当,同时还可以实现加速推理的剪枝网络。在对Res Net56网络剪枝63%浮点运算率时,准确率相较于原始网络精度仅下降0.94%,达到了压缩与加速的目的。2.提出了结合知识蒸馏的随机梯度稀疏优化通道剪枝算法在网络压缩的移动端应用中,往往剪枝后的小型网络才能满足计算资源的限制,而剪枝小型网络往往会带来精度的急剧下降,本文提出了结合知识蒸馏框架的通道剪枝算法,正常剪枝流程中采用基于随机梯度稀疏优化算法的通道剪枝方法,但是在训练中利用教师网络提取到的特征来指导被剪枝的小型网络的训练。通过在Res Net与VGG网络上剪枝40%浮点运算率的实验表明,应用知识蒸馏框架可以使得剪枝模型提高0.3~4.25%的准确率。3.提出了利用通道冗余度进行结构化剪枝算法在网络剪枝中,如何根据设定的剪枝标准选择不重要的通道进行剪枝是关键一步,本文提出了利用KL散度来衡量通道之间的相似度,相似度较高的通道则为冗余通道。针对一个预训练网络,本文根据通道之间的KL散度直接剪枝冗余通道,然后微调剪枝网络直到达到一个较为可观的性能。通过对Res Net网络进行结构化剪枝,利用KL散度挖掘卷积层中的冗余通道,在剪枝率为10~30%时,剪枝网络性能相较于原始网络性能甚至能提升0.4~0.6%。
其他文献
在地球观测卫星逐步投入使用后,通过高分辨率遥感图像进行土地覆盖分类的技术开始问世。历经过数十年的发展,陆地遥感卫星图像的土地覆盖分类方法已经日趋完善。随着近几年遥
区块链是一个共享数据库,是随着加密货币而逐渐盛行的一种网络分布式账本系统,在金融、保险等领域被高度重视和应用。从管理角度来看,区块链最显著的特点是“去中心化”,映射
目标检测作为计算机视觉领域的一个极为重要的分支,其在视觉领域中所起的作用无可替代。随着人工智能、计算机视觉领域的不断发展,目标检测被应用于视觉导航、军事公安以及虚拟现实等诸多领域,但是检测效果并不能真正满足实际需求,因此如何获得更好的目标检测效果成为目标检测领域乃至整个计算机视觉领域亟待解决的问题。在综合分析国内外研究现状的基础之上,并结合深度学习、计算机视觉等相关知识,对如何获取更好的目标检测结
在互联网飞速发展的今天,人们逐渐走进了信息化的时代,Web软件作为信息化发展的产物,在人们的生产生活中扮演着举足轻重的角色。角色权限与功能日志管理作为Web应用系统中基础的通用功能,对Web软件的安全性起到了一定的防护作用。本课题以角色权限与功能日志管理为基础,实现功能菜单驱动的Web软件权限与日志框架,提高Web软件的开发效率。首先,描述了国内外针对用户角色权限与日志的发展状况,提出研究功能驱动
随着人工智能、传感器技术以及可穿戴技术的发展,基于传感器的人体动作识别一直都是近年来研究的热门主题。相比于单个传感器,多个传感器可以对复杂的人体动作实现更高的识别准确度。为了追求更好的性能,往往会出现多余的传感器,这直接带来了额外的传感器费用,使得数据传输、存储和计算负载加重。因此,如何从多个传感器中选择合理的传感器数量和位置组合是该领域亟待解决的一个问题。针对特定的复杂人体动作,基于穿戴设备采集
反垄断法反对排除、限制竞争行为的宗旨与作为合法垄断权的知识产权之间存在潜在的矛盾。这种矛盾在涉及知识产权的经营者集中审查问题上表现为集中后经营者可能出现知识产权
无人驾驶车辆技术近年来发展迅速,已经成为国内外研究的热点方向。无人驾驶汽车辆的设计方案主要有两种,一种是基于规则的设计方案,包含感知、决策与控制三部分,其优点是安全
19世纪末期,《德国民法典》首次以立法的形式对违约金调整制度作出规定,允许司法在一定条件下对违约金条款进行干预。这对其他大陆法系国家产生了深远的影响,违约金调整制度
随着“互联网+”时代的到来,大数据、云计算、移动互联等技术日益成熟并广泛融入教育中,促进了教育理念、教学模式、教学方法与教学管理体制的深刻变革,也给教育带来了空前的
团簇是介于原子分子和宏观物体间的一个新层次,由于其特殊的物理、化学、及磁学等性质,团簇是当前的研究热点之一。某些可以模拟元素周期表中某一原子化学行为的幻数团簇被称