面向移动端的深度神经网络压缩

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:dick_ust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的飞速发展,深度神经网络在许多机器学习任务中,包括计算机视觉、自然语言处理、语音识别方面,都取得了飞跃式的发展。随着深度神经网络性能的不断增强,神经网络的层数越来越多,结构越来越复杂,需要强大的硬件资源才能负担。随着5G的发展,未来社会将充满更多廉价,低功耗的移动设备,研究人员纷纷开始寻求将神经网络部署到移动端设备使其智能化。然而,深度神经网络需要消耗和占用大量的计算开销和储存资源,难以将其直接部署在资源有限的移动端设备上,严重地限制了深度学习的落地场景。深度神经网络压缩技术是一种有效解决该问题的方法。本文主要对模型剪枝和模型量化两种压缩路线展开研究,主要的改进及创新点如下:(1)模型量化:本文针对网络权重和中间层激活值分别提出了新的量化方法,在低比特权重和激活值的量化网络上不存在明显的精度下降。针对传统激活函数不适用于量化任务的问题,提出一种新的激活函数CReLU。在训练过程中CReLU函数能够自适应调节截断参数来平衡动态范围,减少量化误差。同时本文给出了CReLU截断参数合适的初始化和训练方法。相比于传统的激活函数,CReLU在量化和非量化任务下均获得了更好的性能表现。针对网络权重二值化精度损失过大的问题,提出了一种多阶二值化方法,能够更好地近似原始网络权重,进一步减少一阶二值化损失精度,同时保持二值操作的优势。通过理论分析和实验表明,所提出的方法都能取得比之前工作更高的量化精度。(2)模型剪枝:模型剪枝方法对模型中冗余的参数进行裁剪。由于神经网络中参数层类型和位置的不同导致其参数冗余度也不同,因此模型剪枝算法的挑战在于如何选择一个合适的压缩策略。传统的模型剪枝算法通常使用人为确定的规则或基于启发式算法来制定压缩策略。然而,深度神经网络的复杂性使得这些方法十分耗时且效果较差。本文提出了一种基于强化学习的自动化分层剪枝算法来生成最优的压缩策略。所提出的方法构造了一个模型剪枝环境,使得智能体能够在奖励信号的帮助下自动识别出网络每层的冗余度。实验表明,该方法能很好地平衡模型精度、模型大小以及计算复杂度,并显著优于传统的压缩策略。综上所述,本文针对模型剪枝和模型量化两种技术路线分别提出了相应的改进和创新方法。针对模型量化任务,本文提出了新的激活函数和多阶二值化方法;针对模型剪枝任务,本文提出了自动化分层剪枝算法生成最优的压缩策略。实验结果和理论分析均表明本文所提出的两种深度神经网络压缩技术的有效性。
其他文献
随着科学技术的发展,物联网技术逐渐走进大家的日常生活,从智能家居、安防监控到自动驾驶、环境监控,互联网时代下的物联网正在悄无声息地改变着人们的生活方式,人们对于物联网的需求也日益增大。物联网的发展离不开基础网络设施的发展和建设,而作为一个传统的发展中国家,在中国的农村地区和部分偏远地区,基础设施建设不完善,这部分的人口享受物联网带来的便捷和物联网经济带来的红利就变得艰难。因此,寻求一种适用于中国农
认知科学和神经影像学领域的研究已经表明,情绪是一种极为复杂的行为和生理反应,它涉及到大脑中多个区域的回路。然而,目前在基于脑电信号和眼动数据的多模态情绪识别研究中,通常采用的是基于单通道分析的脑电特征提取方法,而未考虑到情绪所对应的脑功能连接网络。本文主要基于脑电信号来探索情绪所对应的脑功能连接网络模式。我们提出了一种与情绪相关的关键子网络选择算法,并提取了三种脑功能连接网络特征:连接强度,聚类系
为了在有限的资源上实现更多的连接,提高系统的频谱效率,非正交多址接入(Non-orthogonal multiple access,NOMA)技术被确定为第五代移动通信系统候选空口技术之一。作为码域的NOMA技术,多载波低密度序列(Multi-carrier low-density signature,MC-LDS)技术和稀疏码多址接入(Sparse code multiple access,SC
数据增强作为一种简单有效的方法被广泛应用以提升模型泛化能力,特别是在训练深度神经网络时。近年来研究人员们提出了不少新的数据增强方法进一步提升分类任务的准确率,其中主要以两类为首:Mixup这类对两张图片进行线性插值的方法,以及AutoAugment这类搜索最佳数据增强策略的方法。在本文中,我们针对Mixup中线性假设的不合理性,提出了一种基于特征空间距离的自监督方法,该方法要求原始图像和生成图像在
图像标题生成是自动给图像生成一个描述性标题,这是一个结合计算机视觉和自然语言处理的重要研究方向。图像标题生成可以辅助图像搜索和视频搜索,有着巨大的应用价值。当前主流的方法是基于注意力机制的图像标题生成。虽然图像标题生成已经被研究了很多年,但是现有方法生成的标题和人类给出的标题相比还是有很大的差距。本文主要是对基于注意力机制的图像标题生成进行改进,提高模型生成的标题的质量。本文在两个方向上对图像标题
随着流媒体业务的飞速增长,移动数据流量持续呈现井喷式增长的趋势。为了缓解通信网络的压力,采用缓存技术卸载数据流量行之有效。而且,用户协作缓存将大大降低缓存内容放置的成本。为此,本文对基于反向拍卖的无线业务协作缓存技术进行了研究。在本研究中,我们考虑用户终端(UTs)协作将无线热点业务缓存到智能路由中继(IRR)侧的方案。为了有效激励用户参与协作缓存任务,本文构建了基于反向拍卖的协作缓存模型,其中,
太赫兹成像是以太赫兹辐射作为信号源的成像技术,有低光子能量和高透明度的优点,因其非电离的特点被广泛应用于安检、生物诊断、电子元器件认证等领域。太赫兹辐射的波长较长,因此成像分辨率较低,图像质量也较差,需要进一步处理才能应用与实际场景中。本项研究探索了有源主动反射式成像的太赫兹图像的噪声建模和去噪算法。经过对太赫兹噪声的统计分析,我们发现太赫兹噪声符合一种广义的高斯分布,即-稳定分布,它能够描述非对
目标的细粒度分类技术已经成为交通监控系统中的关键一环,被应用于车辆目标的实时车型识别任务。针对车辆目标的图像,细粒度分类算法需要在车辆目标这个大类别中,对其中数百个子类别进行细粒度分类,识别出不同的车型信息。虽然在理想环境中,只需要检测单帧图像中的车辆号牌即可通过后台查询得到具体的车型信息。但在复杂多变的环境条件与车辆号牌污损情况下,无法直接得到车辆号牌信息,因此不能保证精准车型信息的有效获取。目
随着智能终端的迅速发展和广泛普及,无线网络下的移动多媒体数据流量呈现爆炸式的增长。与此同时,智能终端设备的本地缓存能力有了长足的发展,通过在无线网络的终端侧预先缓存网络所需要的内容并对周围用户分发共享能够显著的降低网络的空口压力并且减少网络流量的大量冗余重复传输,给无线通信网络带来性能上的大幅提升。因此有必要对于终端用户的缓存策略进行深入研究,以达到较好的缓存策略和性能。在本文中,我们首先考虑了设
近年来我国车辆产业蓬勃发展,车辆数量呈现井喷式增长。车联网体系主要包括基于LTE资源的C-V2X架构与分布式VANET架构,二者均能够为车辆提供数据服务与行驶信息,辅助司机驾驶,有效减少交通事故的发生。路由算法是车联网通信中的关键技术之一,路由的决策很大程度上影响了车辆间通信的传输性能。在车联网场景下,车辆运动速度较快,车辆间链路不稳定,传统的路由协议效果欠佳。本文针对不同网络结构提出以下路由改进