基于结构搜索的深度神经网络剪枝方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wzgl2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络在图像分类、检测以及动作识别等多种视觉任务上取得了巨大的成功。但是由于现有深度神经网络结构复杂,计算复杂度高,因此难以在移动设备和计算能力受限的设备上直接应用。因此,神经网络剪枝,作为一种模型轻量化和计算加速工具,近年来开始受到来自学术界和工业界的关注并被广泛应用于实际的深度模型部署应用中。深度神经网络剪枝算法的核心是通过剪除冗余的滤波器参数以获得紧凑的深度神经网络,现有的深度神经网络剪枝方法大多需要对深度神经网络进行预训练,并依赖手工设定的滤波器度量标准衡量网络结构的重要性并进行剪枝。然而这种基于手工设计的度量标准依赖研究者的经验,存在鲁棒性差、调参困难和精度差等问题,而预训练流程会增加剪枝算法的计算复杂度。针对以上问题,本文提出基于结构搜索对神经网络进行自动化剪枝的方法,直接从冗余神经网络中得到紧凑神经网络。本文的具体研究内容与贡献如下:·针对现有剪枝方法需要先预训练然后进行剪枝导致剪枝过程冗长、计算复杂度高的问题,本文提出了一种基于联合搜索与训练的快速神经网络剪枝方法,直接从头开始搜索得到一个紧凑的神经网络。为了提高剪枝的效率,通过将剪枝视为一种搜索策略,本文提出基于结构搜索进行剪枝并获得紧凑的网络结构。同时,为了提高剪枝的鲁棒性,本文采用一种基于阈值生成网络进行自动化阈值生成的动态修剪策略和一种基于多教师网络的知识蒸馏方法。实验证明,该方法在保证剪枝算法的性能不下降的前提下可以有效提高算法的效率。·针对现有剪枝方法在高剪枝率下剪枝效率会大幅度降低这一问题,本文提出了一种基于网络结构拓展搜索的滤波器剪枝方法。与传统的在固定网络空间中寻找滤波器组合的剪枝方法相比,本文主张采用”先拓展再裁剪”的策略以提高结构搜索的效率。具体来说,本文首先构建了一个扩展的搜索空间,并引入一种基于高斯尺度混合模型的全局组稀疏系数用于衡量滤波器的重要性,最后通过一种新颖的确定性退火策略对网络进行迭代的剪枝。通过研究与大量的验证性实验,本文发现,通过结合拓展的搜索空间与全局稀疏度,基于结构搜索的剪枝方法可以搜索到更合理的紧凑神经网络结构。在紧凑网络的参数量减少以及高剪枝率下的表现上,本文提出的方法均优于现有的剪枝方法,是一种尤其适合于实际部署应用的剪枝技术。·迭代剪枝是一类逐渐剪去网络参数的剪枝技术,由于剪枝损失可控、精度高而逐渐成为主流的剪枝策略。但现有的相关剪枝方法忽略了在迭代剪枝过程中相邻轮次之间的相互影响,因而在剪枝过程中会不断地积累误差并导致额外的性能下降。针对迭代剪枝中存在的这一问题,本文提出了一种通过贝叶斯估计进行修剪并重参数化的迭代剪枝方法。在每轮剪枝中,本文首先基于之前剪枝轮次的结果估计一个贝叶斯模型,并基于这个模型对不同通道的剪枝概率分布进行预测,而预测的概率会被用于剪枝。在具体的剪枝过程中,为了减少剪枝带来的精度损失,本文还根据概率分布对修剪后的网络进行重新参数化。在多个流行数据集上的实验结果表明,提出的方法可以在迭代剪枝的过程中对剪枝结果进行精准预测,有效地提高了剪枝的效率和准确度。
其他文献
背景与目的小分子干扰核糖核酸(Small interfering RNA,siRNA)作为一种极具前景的基因靶向药物,可广泛用于诸如癌症等基因变异疾病的治疗。然而,如何保持siRNA递送过程的稳定性和组织靶向性,依然是限制siRNA临床转化及大规模应用的主要问题。随着生物工程和纳米技术的进步已经产生了许多纳米递送载体,其中包括脂质体,聚合物,肽和无机物等纳米粒子。但是这些纳米载体仅仅被设计解决递送
学位
背景和目的食管癌是目前全球癌症发病率和死亡率分别排名第六位和第七位的癌症,五年生存率低于20%。食管癌的发生具有地域性,在中国尤其是太行山脉附近省份高发。食管癌主要有两种病理分型,食管鳞癌(Esophageal squamous cell carcinoma,ESCC)和食管腺癌(Esophageal adenocarcinoma,EAC),而中国90%食管癌患者为食管鳞癌。食管癌是恶性程度很高的
学位
固体氧化物燃料电池是一类以使用固体氧化物作为电解质为特征的燃料电池,相比于其它类型的燃料电池,它们的工作温度较高(600℃到800℃),因此不需要昂贵的铂金属作为催化剂材料,不易受到催化剂一氧化碳中毒的影响,然而较高的工作温度使其在成本和安全方面阻碍了商业化进程。为了进一步降低固体氧化物燃料电池的工作温度,就需要研发出新型的在中低温下拥有高氧离子电导率的电解质材料,同时由于工作温度降低导致极化电阻
学位
目前,我国各项基础建设已经逐渐完善,能够为人民提供全方位的服务。大型公建及综合性医院是为人民群众提供基本医疗服务的重要存在,是城市建设中的一项重大的公共基础建筑。然而,大型公建及综合性医院的运行与机电工程密切相关,许多检测项目都要靠机电设备来进行。因此,本文就重点分析了大型公建及综合性医院机电安装施工技术,并对技术管理措施进行了探讨,希望能对相关人员开展工作提供帮助。
期刊
癌症的早期诊断和高效治疗是预防癌症和提高患者生存率的关键。因此,发展高效的癌症生物标志物分析方法和治疗策略具有重要的意义。金属有机框架(MOFs)是一类由金属离子与有机配体形成的多孔配位纳米材料,具有比表面积大、负载效率高、易功能化修饰、可生物降解等优点,在生物标志物检测与治疗领域展现出广阔的应用前景。然而,由于MOFs本身功能的局限性,迫切需要对其进行功能化修饰,以发展具有识别、治疗以及疗效监测
学位
随着科学技术的不断发展和信息技术的不断更新,互联网和移动通讯等技术的高度普及等产生了海量的数据,大数据已成为当今最重要的时代特征。如何充分利用这些海量数据催生了数据分析和数据挖掘。子空间聚类是数据分析和数据挖掘领域的关键技术之一,是实现高维数据聚类的有效途径。本文主要研究了面向子空间聚类和CT图像重建的稀疏、低秩方法。在重加权稀疏子空间聚类的基础上,利用数据间几何关系引导建立重加权的稀疏子空间聚类
学位
第三次科技革命以来,人类社会步入了信息爆炸、数据海量增长的多源大数据时代。在人类社会生活中存在海量的按一定次序关系排列的序列数据,如文本数据,语音、图像、视频、基因序列等等,而如何对高维复杂序列数据的序列关系进行分析并有效利用,引起了研究学者的广泛关注。基于深度动态模型的序列建模方法,通常以数据为驱动,对数据的统计特征及其它相关特征进行有效提取,并根据历史观测数据建立对未来数据进行建模与预测。在现
学位
目的:探究不同温度膀胱冲洗液在良性前列腺增生(BPH)患者经尿道前列腺电切术(TURP)术后并发症中的干预效果。方法:选取2019年1~2020年6月行TURP的良性前列腺增生患者153例,按照冲洗液温度采用临床随机对照试验法将其分为A、B、C三组,各51例。A、B、C组的冲洗液温度分别为18~20℃、22~25℃以及35~37℃,比较三组患者冲洗前后的生命体征、冲洗期间膀胱痉挛情况、各时段冲洗液
期刊
当高超声速飞行器在临近空间飞行时,飞行器周围空气在急速压缩冲击下形成激波并产生高温,高温使气体电离,形成包覆飞行器表面的等离子体,称为“等离子体鞘套”。等离子体鞘套会对电磁波产生散射吸收,使电磁波出现大幅衰减和相位偏移,即寄生调制效应;同时等离子体鞘套具有高动态、快时变特性,也会影响高超声速飞行器遥测信道。现有的遥测调制解调方法难以适应高超声速飞行器遥测信道,需要研究相应的调制解调方法以及联合解调
学位
学位