深度神经网络压缩与优化研究

来源 :电子科技大学 | 被引量 : 15次 | 上传用户:wangyang062011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是近年来机器学习领域最有影响力的研究方向,在计算机视觉、自然语言处理的许多问题上都取得了突出的效果。深度学习的本质是大数据支撑下,由多层人工神经网络堆叠形成的信号处理系统,具有参数数目多,计算复杂度高等特点。深度学习的训练和运行都需要大量的运行空间与并行计算设备,这些需求阻碍了深度学习在资源有限的设备,如手机、平板电脑和嵌入式设备上的应用。另一方面,神经网络中普遍存在过参数化的问题,对于一个具体任务而言,网络的参数存在着极大的冗余。深度网络压缩是解决此类问题的关键技术。本文属于深度网络压缩的研究方向,其主要工作有:1.神经网络压缩方法归纳总结在对深度学习的发展现状和主要方法、模型、技巧做了介绍后,我们广泛研究了当前的神经网络压缩的方法,并将当前的网络压缩方法归纳为“近似”、“量化”与“裁剪”三种类型。近似类算法依靠张量分解为网络参数寻找开销更小的表示方法,量化类方法将网络参数从实数域映射到有限集合,实现参数共享,裁剪类方法检测和删除网络中的冗余层、冗余神经元或冗余神经连接,将直接改变网络的结构。2.神经元贡献评价与消偏我们针对神经元级的裁剪进行研究,首先我们通过特征图可视化的方法展示了网络中存在的冗余现象。随后,我们从前人工作中推广出三种用于评价神经元贡献度的方法。这些方法能够在逐层的网络裁剪中使用,但在全局裁剪中,当把不同层的神经元评分统一考虑时,存在显著的系统性偏差。我们提出了一种简单的消偏方法,使得全局神经网络裁剪成为可能。3.渐次全局神经元裁剪框架与实现基于消偏后的神经元评分,我们提出一种渐次的全局网络裁剪框架。与逐层裁剪相比,该框架避免了网络裁剪时确定各个层中冗余神经元数目的难题,大大降低了裁剪所需要的微调轮数,并能够在给定的性能指标下逐渐逼近网络的近似最优结构。在实验部分,我们基于开源深度学习框架Keras实现了所提出的算法,并设计一系列实验验证了所提方法的有效性。
其他文献
音频分析是多媒体信息处理中一个重要的角色。音乐是由不同的乐音通过有组织、有规律的组合创造出来的艺术,以演唱或演奏的形式表达人的思想情感,其内容充满意志,反映现实世界,人
在原有短波选频通信系统的基础上,参考第三代短波通信的新技术,实验室提出一种新型的选频与建链通信系统。以该项目为依托,本文主要研究新型短波通信系统数据链路层协议中自动链
视觉作为人类认知世界的最直观的方式。数字视频紧随着IT的浪潮,获得非常迅速的发展。但是,一个完整的视频是由个大量的数据信息组成,而视频要想获得实际的应用,就必须对视频
无线信道的衰落特性是影响无线信号传输质量的主要因素,信道编码技术与分集技术可有效抵抗信道衰落。分布式Turbo码协作方案和率匹配Turbo码协作方案是两种将Turbo码与协作分
波达方向估计(DOA)是阵列信号处理领域的重要研究方向,目前基于阵列的空间谱估计是DOA估计的主要实现方法。现有的空间谱算法需要大量的快拍数以保证协方差矩阵估计的精度,这些都
人脸识别是一种被应用广泛的生物识别技术,相比较基于指纹、虹膜等生物特征的生物识别方法来说,基于人脸的生物识别方法更加方便、友好和隐蔽,因此人脸识别技术越来越被广泛
正电子发射断层成像(Positron Emission Tomography,PET)这一检测技术可谓是如今核医学中最先进的,成像方面也一直在深入研究。PET的原理是将一定量的放射性核素注射到人体内,这
用涡流测厚仪测量诸如固体火箭发动机等曲面基体上的绝热层厚度时,由于无法在曲面基体上对涡流测厚仪进行标定,只能采用在平板基体上标定后,测量曲面基体上涂层厚度的方法。然而
本文主要介绍了基于Windows Embedded CE6.0嵌入式操作系统作为控制系统的深海海底原位监测系统的硬件平台和软件平台。本系统采用了搭载Windows Embedded CE6.0嵌入式操作系
随着卫星通信与网络技术的不断发展,能够提供多媒体业务、实现高速传输与交换、全球无缝隙覆盖的宽带多媒体通信卫星网已成为新一代卫星通信发展趋势。由于卫星通信网的大时延