深度神经网络剪枝方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ayelili
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习,一种利用深度神经网络(Deep Neural Network,简称DNN)从数据中学习的机器学习算法,在最近几年正成为图像分类、语音识别和自然语言处理等领域的主流算法。然而现有的深度网络模型参数众多,导致其具有占用存储空间大和推断速度慢等缺点,从而限制了DNN在硬件条件有限的终端如手机和可穿戴智能设备上的应用。为了解决这个问题研究者提出了很多压缩和加速DNN的方法,其中剪枝(Pruning)是一类简单但非常有效的方法。剪枝即在维持DNN性能不下降的条件下删除某些不重要的部分。根据删除对象的不同,剪枝可分为权值剪枝和神经元剪枝,前者删除DNN中不重要的权值,而后者删除DNN中不重要的神经元。尽管DNN剪枝正受到越来越多研究者的关注,但仍有很多重要问题没有得到很好的研究。其中有三个问题是本文觉得需要迫切解决的:1)如何使DNN训练与剪枝同时进行的问题;2)如何设计更高效的神经元剪枝算法的问题;3)如何在特定任务上应用DNN剪枝的问题。本文针对这3个问题展开了研究,本文的主要贡献有:1.本文提出了一种可以使DNN训练和剪枝同时进行的方法。以往的DNN剪枝方法依赖于一个预先训练好的参考模型,即显式的分为训练和剪枝两个阶段,然而训练DNN本身是一个费时费力的过程。本文通过分析剪枝阈值对整个剪枝算法的重要作用,提出了一种基于可变阈值的从头剪枝方法(Pruning from scratch)。在该方法中,剪枝阈值不仅可以根据DNN训练进行动态改变,而且可以自适应于DNN训练过程中权值的分布变化,从而在训练完成的同时完成对DNN权值的剪枝。2.本文提出了一种新的基于优化非线性重构误差的逐层剪枝神经元的方法(Layer-wise Neuron Pruning based on Nonlinear Reconstruction Error,简称LNP-NRE)。与以往的逐层剪枝神经元方法使用的线性重构误差不同的是,非线性重构误差考虑了DNN中的非线性激活函数,因而是一个更加合理的优化目标。基于此优化目标,本文提出了一种新的逐层剪枝神经元算法LNP-NRE。实验结果证明了LNP-NRE在相同水平的准确率损失下,可以比现有方法剪枝更多的神经元。3.本文针对细粒度图像分类任务,提出了基于注意力机制的卷积神经网络通道剪枝的方法(Attention-based Channel Pruning,简称ACP)。卷积神经网络(Convolutional Neural Network,简称CNN)是DNN中专门用于处理图像相关任务的网络模型,CNN通道剪枝与DNN神经元剪枝相对应。剪枝后的网络通常运行在像手机或可穿戴设备这样的个人设备上,这就意味着在剪枝的实际使用场景中,小规模细粒度分类任务占的比例更大。然而,由于数据量的缺乏,直接在此类任务上训练CNN会导致严重的过拟合,因此本文首先通过迁移学习把在通用任务上训练的CNN迁移到细粒度分类任务上,然后通过注意力机制与稀疏正则化方法的联合使用对CNN中的冗余通道进行剪枝。实验结果验证了ACP方法的有效性。
其他文献
国务院办公厅最近印发《关于促进“互联网+医疗健康”发展的意见》(以下简称《意见》),明确提出了健全“互联网+医疗健康”服务体系、完善“互联网+医疗健康”支撑体系、加强
期刊
大气下以超声波作为钎焊的辅助工具,采用Sn4Ag1Cu4Ti钎料对紫铜与石墨焊接.采用SEM和EDS进行微观组织分析,并对施加超声波后紫铜与石墨界面钎焊接头处微观组织的形态特点和界
本文对ZJ19卷烟机烟支滤嘴接装过程进行了分析,分析了原机质量检测器存在的缺陷,利用光电检测技术,设计一种新型烟支缺滤嘴检测装置,对ZJ19卷接机生产过程中出现的无过滤嘴烟
目的探讨不同封片参数在全自动封片机中应用的封片效果。方法选择600张HE切片,将切片分为三组,每组200张:A组为2档剂量的封片胶,B组为3档剂量封片胶,C组为4档剂量封片胶进行金自动
馓子的命运是凄冷的,源于它的陈腐、守旧;方便面的命运是辉煌的,因为它的开放、创新。我们课堂的命运掌握在我们每一个人的信念与奋斗中,愿我们用自己的聪明才智,给学生们撑起一个
面对日益激烈的竞争市场,一些大中型房地产项目分期开发投资策略所采用的传统评价和决策方法存在诸多局限。本文构建了双因素随机变量期权博弈模型,推演出三种不同博弈(抢先、追
作为全国唯一没有平原的省份,贵州省在认清交通是制约全省经济社会发展“瓶颈”的同时,紧抓交通基础设施建设。以“大旅游”作为发展战略,将“四个创新”作为”交通+旅游”融
医院作为一个特殊的行业,其特点是流动人员多,并且是各种传染病源集中的高危地区,这给医院的安全管理提出了特殊的要求。而门禁管理系统可有效的提高医院该方面的管理效率和
文中利用钻井、测井、地震等资料识别出英台断陷深层存在岩浆侵入体,结合热量守恒原理和化学动力学模型定量评价岩浆侵入体对烃源岩生烃的促进作用.实验及模型模拟结果显示,
建立了硅钼蓝光度法测定锰铁中硅含量的分析方法。在选定的实验条件下,硅的吸光度与质量浓度在0~125ug/50mL范围内呈线性关系。本法用于锰铁中硅的测定,操作简单,分析速度快,