基于计算机视觉的结构化深度神经网络压缩

来源 :浙江大学 | 被引量 : 0次 | 上传用户:weiwen1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉任务方面取得了显著的成功。然而,CNN通常会产生大量的计算和存储消耗,从而阻碍其在移动和嵌入式设备上的部署。为了解决这一问题,许多研究工作都集中在压缩CNN的规模上。模型压缩作为一种可以通过降低深度神经网络冗余度来减少网络模型的存储大小、加快其运行速度的新兴研究领域,被广泛应用于诸如物体识别、分类,检测等计算机视觉任务中。在本文中,作者将基于参数剪枝与知识蒸馏两种常见的压缩方法对深度神经网络模型压缩进行一定的研究与应用探索。本文的主要工作和贡献如下:1、参数剪枝作为一种简单而又有效的模型压缩方法,它根据一定的标准,对网络中冗余的权重进行修剪并保留重要权重,以最大限度地保持网络的精确性,能够大幅减少参数数量,压缩空间,从而达到降低模型计算量与存储量的目的。结构化剪枝因为其避免了非结构化剪枝所产生的随机连接,导致不规则存储访问的问题,被广泛应用于CNN的加速。通常,结构化剪枝主要分为结构化行稀疏与列稀疏两种方式,目前大部分工作是对卷积核通道或者是卷积核本身进行修剪,属于行维度的剪枝。在本文中,作者基于在同样的稀疏度需求下,从列维度下选取需要稀疏的权值比起在行维度下选取有更大选择空间的理论依据,提出在对同一网络的相同加速比要求下,结构化列剪枝将会获得更好的性能。实验结果表明,对于两种结构化剪枝,在GFLOPs减少相同倍数时,列剪枝后的准确率和实际加速等性能相对于行剪枝都有明显的提升。2、本文深度参与了国家信息产业部下的信息技术神经网络表示与压缩标准的制定。根据“新一代人工智能产业技术创新战略联盟标准工作组神经网络表示和模型压缩标准的技术需求”的要求,在模型的结构化稀疏方面,作者提出并发表了技术提案《基于增量正则化剪枝的结构化深度神经网络压缩》,解决了传统上直接分配恒定正则化惩罚而导致压缩模型表现力弱的问题,促进了神经网络表示与压缩技术的标准化。3、知识蒸馏作为除参数剪枝外的另一种有效的神经网络压缩方法,它将知识从高容量的教师网络转移到低容量的学生网络,使学生网络能够获得更好的性能。基于此,本文提出了一种通过同时训练多个学生模型实例的新方法。该方法通过将相似性与多样性损失添加到基线知识蒸馏中,并根据多个学生实例的准确度变化来自适应的调整这些损失的比例,以此构建一个可以使学生之间进行相互协作与竞争的蒸馏系统,从而更好地提升系统的健壮性以及各个学生网络的性能。该方法在各种规模的数据集上获得的性能均优于现有的离线和在线蒸馏方案。
其他文献
我国大部分农村地区饲养畜禽以家庭散养为主,既可实现自给自足,亦可提高畜禽健康,但因其环境的复杂性给农户造成一定的经济损失。林下养殖的开展将林业和畜牧业有机地结合,两者互利共赢。结合我国江浙地区竹林业生产规模大的特点,本论文旨在比较研究竹林散养(Free-range raised in bamboo forest broilers,BFB 组)和家庭散养(Free-range raised in f
卷积神经网络(CNN)已经广泛应用于深度学习应用领域,尤其在耗电量较大的GPU上。而最近有研究表明,设计CNN硬件加速器是一种更高能效的解决方案。但随着深度学习研究的发展,先进的卷积神经网络参数数量不断增多、计算量不断增大,导致神经网络部署时会遇到计算功耗过高与内存大小受限的困难。为了降低计算量,一些研究提出了对CNN权重稀疏化的方法。在CNN训练时随机将网络中小于某一阈值的权重置为零或量化为更少
我国用水资源相对短缺,并且存在大量的城市供水管网漏损现象,这不仅给社会带来了经济损失,也严重影响了居民的正常生活。而对供水管网进行漏损预测,可提前感知漏损事件,有效控制漏失的水量,对我国水资源工作具有重大意义。本论文结合独立计量分区(District Metering Area,DMA)对供水管网的漏损检测进行研究,具体工作如下:(1)本论文对目前常用的城市供水管网漏损预测方法进行了总结。并通过实
随着无人驾驶技术的不断发展,基于完整地图信息的路径规划技术已经发展得较为成熟,但还不能完全满足实际的需求。在现实环境中,我们无法依赖先验地图获得完整的信息,仅能获得地图中的部分静态障碍物信息。当无人车处在存在动态障碍物(例如行人、其他车辆等)的动态环境中时,对很多实际任务,如跟随驾驶与动态避障的能力都提出了更高的要求。本文针对动态环境下无人车的跟随行驶和避障规划进行系统的研究,主要工作与创新如下:
近年来,卷积神经网络技术快速发展,其优异的性能已经在计算机视觉的多个领域得到广泛研究和验证,并取得卓越的效果。然而卷积神经网络也存在着参数量和计算量大、能耗大等缺点,限制了其在实际工业中的推广应用。因此模型的压缩和加速成为当下的一个重要研究方向。本文同时关注计算机视觉中的高级视觉任务和低级视觉任务。针对分类问题,我们提出两种结构化剪枝方法(ACO和ALI)对模型进行压缩。而对于低级视觉任务的超分辨
传统方法一般将通信物理层问题建模成特定的数学模型,使得通信过程具有一定的可解释性。但在有些复杂场景下,通信问题难以精确建模,或者建立的模型过于复杂,增加了算法复杂度,难以支撑低时延的约束。而近年来,基于数据驱动的深度学习技术在通信系统中的应用也逐渐成为当前的研究热点。深度学习技术具有强大的表征能力,可以从大量的训练数据中学习到数据分布间的复杂关系,且分布式和并行计算的架构保证了其高效的计算处理能力
运动捕捉技术是一种将被观察目标的运动姿态信息转化为具体的数字化信息,通过数字化信息还原姿态的技术。可应用于康复训练、智能机器人和虚拟现实等人机交互领域。本文采用基于微机电系统(MEMS,Micro-Electro-Mechanical System)的惯性传感器研究和设计了一套运动捕捉装置,本次设计的运动捕捉装置从结构上分为三部分:传感节点、数据汇聚节点以及计算机终端。整体的数据传输网络结构采用改
人们对通信传输速率和系统容量的需求持续增长,给有限的频谱资源带来了巨大压力。目前主流的解决方案有两种,一种是探索更多的频谱资源,另一种是提高频谱效率。全双工(Full-Duplex,FD)通信技术能够使通信设备在同一频段上同时进行通信,理论上能够实现频谱效率的倍增,在第五代移动通信(The fifth generation mobile communication technology,5G)和未
水声传感器网络(Underwater Acoustic Sensor Networks,UASNs)作为获取大规模海洋信息的重要手段,已广泛应用于海洋监测、资源勘探、灾难预防和战术监视等诸多领域。由于水声信道的长传播时延、高误码率、链路频繁中断等特点,UASNs在数据传输可靠性方面一直面临着重大挑战,传统的传输控制协议/网际协议(Transmission Control Protocol/Inte
集成电路工艺制程十分复杂,在整个制造过程中会出现很多系统性工艺故障,及时地定位和解决这些故障能够保证集成电路的良品率和产品质量。不同的系统性工艺故障会在晶圆图上形成不同的故障图案,因此,可以通过对晶圆图故障图案(Wafer Map Defect Pattern,WMDP)进行分类来定位工艺故障。这也一直是学术界和工业界关注的一个热点,这种方式也被称为晶圆图故障图案识别(Wafer Map defe