卷积神经网络压缩算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：lwm1976

【摘要】

：

近年来，深度学习已经成为机器学习领域一个重要的研究方向。深度模型通过特有的深层结构从输入数据中挖掘更加抽象的具有良好泛化能力的特征来解决浅层模型提取特征不足和特征

【作者】

：

舒红乔

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

卷积神经网络压缩算法权重参数分解模型减枝可学习参数共享

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，深度学习已经成为机器学习领域一个重要的研究方向。深度模型通过特有的深层结构从输入数据中挖掘更加抽象的具有良好泛化能力的特征来解决浅层模型提取特征不足和特征维度过多等问题。卷积神经网络(Convolutional Neural Networks，CNN)作为深度学习一个重要的研究领域，也获得越来越多的关注。　　相较于仅拥有全连接层的深度神经网络，卷积神经网络的时间和空间复杂度均得到有效降低。但随着计算机视觉领域对机器智能化需求的提高，卷积神经网络的结构设计得愈加复杂，所需的计算量和存储空间也随之大大增加。这使得卷积神经网络在资源有限的移动终端和嵌入式设备上的应用存在很多困难，因此压缩卷积神经网络，减小其占用的存储空间和计算资源成为一个重要的研究方向。　　论文从三个方面研究卷积神经网络的压缩算法:分解权重参数、模型减枝、可学习参数（权重参数、偏置参数）共享。针对权重参数分解，本文研究了三种算法，第一种是基于奇异值(SVD)对通过正则项约束得到的低秩权重参数矩阵进行分解，第二种是通过Kronecker积分解全连接层权重参数矩阵，然后在反向传播模型误差时更新Kronecker积分解得到多个参数较少的小权重参数矩阵。由于Canonical polydic(CP)分解可用来分解卷积层权重参数，在此基础上，受可通过反向传播模型误差更新Kronecker积分解得到小矩阵的启发，本文提出了一种通过反向传播模型误差来更新CP分解卷积层权重参数得到的向量，再由向量外积和作为卷积层权重参数的方法。　　针对模型减枝，本文根据裁剪粒度不同探讨了两种减枝算法，第一种对模型局部减枝，裁剪对象是模型神经元之间的连接、特征图像素点之间的连接，算法关键在于将裁剪和拼接融合在一起，动态衡量连接的重要性，裁剪不重要的连接。第二种对模型整体减枝，裁剪对象是神经元和特征图，算法将神经元和特征图的组参数作为正则项，作为目标函数的一部分，实现对神经元和特征图的裁剪。　　针对可学习参数共享，本文研究了两种共享算法，第一种是将模型所有可学习参数聚类至2的幂次方或0值（某连接被裁剪），在此基础上，本文提出了一种通过更新最后一部分聚类的可学习参数的梯度的方法，从而弥补由于聚类比特数过少导致模型性能的剧烈下降。此外，本文还提出了一种共享权重参数的算法，该算法实现全连接层和卷积层权重参数共享，针对全连接层，该算法通过Toeplitz矩阵对模型全连接层权重参数实现共享，针对卷积层，该算法利用循环共享的思想，提出可基于输入和输出两个角度对模型的卷积层权重参数实现共享。

其他文献

低码率视频通信的相关技术研究

最近,通信领域中视频业务在快速增长,因为视频业务依赖的支撑网络不能提供QoS保证和重建图象主观质量失真与编码速率之间存在矛盾,对编码算法的压缩效率和抗误码性能提出了新

学位

通信领域视频业务压缩效率编码算法矢量估计

国画

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

国画

新预算法对行政事业单位财务管理的影响探究

在新预算法理念下,行政事业单位内部的财务管理工作迎来了新的挑战,导致财务管理工作出现了不同程度的问题,不仅会影响工作的顺利开展,严重时还会产生财务风险.为避免财务风

期刊

新预算法行政事业单位财务管理影响

浅析全面预算管理对行政事业单位财务管理的影响

在我国行政事业单位运行管理中,全面预算管理是非常重要的工作项目.在当前社会环境下,全面预算管理工作的开展,能为行政事业单位的财务管理水平的提升提供保障.本文对全面预

期刊

全面预算管理行政事业单位财务管理影响

全数字式高分辨率机载SAR实时处理机研究与实现

近年来随着DSP技术的飞速发展,加之高分辨率SAR实时成像技术在军事、国民经济和科学研究方面的有着重要地位,SAR实时处理机因而受到各国的重视.该文研究并实现了基于CS算法的

学位

实时处理DSP技术FFTCS算法

多巴胺受体D5B转基因大鼠的建立及行为学研究

我们克隆得到了人类多巴胺受体D5基因的一个新亚型D5B。D5B基因的序列与D5有98％同源性，与D5的两个假基因有94％同源性。D5B基因与假基因不同，含有一个完整的开放阅读框，能够编码比D

学位

多巴胺受体D5转基因大鼠动物行为学

基于DSP的混沌信号处理

该文首先从应用的角度上研究了混沌动力学的基本原理、混沌信号的特性（确定性和随机性）以及混沌系统的同步原理,深入讨论了应用于数字信号处理器DSP处理的数字混沌信号的随机特

学位

混沌动力学混沌同步DSP混沌信号发生器混沌信号处理

浅析新租赁准则对我国航空公司的影响

新租赁准则的颁布对我国企业的经营活动产生了一定的影响,同时也会对我国航空公司经营也会产生一定的影响.文章以此为分析对象,首先介绍了我国租赁准则变化的主要内容,接着阐

期刊

租赁航空公司变化

浅析精装住房项目管理——以A楼盘为例

本文通过对荣华二采区10

期刊

番茄miR172的抗病功能研究

MicroRNA (miRNA)作为一类生物体内普遍存在的长度为21-25个核苷酸的内源性非编码小分子RNA,在植物抵抗病原物过程中起着至关重要的调控作用。miR172作为植物体内一类保守的m

学位

番茄miR172AP2病原菌

卷积神经网络压缩算法研究

与本文相关的学术论文