基于多目标优化的轻量化深度学习技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：shan43512

【摘要】

：

【作者】

：

马向前

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

深度学习模型剪枝人工蜂群算法知识蒸馏多目标优化多目标免疫算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

深度神经网络的轻量化是其在边缘嵌入式设备实现的必要步骤,主要包括参数量化、模型剪枝、轻量卷积核设计、知识蒸馏等几类方法。现有方法中,模型轻量化（或模型压缩）大多被抽象为给定资源约束下的单目标优化问题,如性能约束、参数约束等。然而,深度神经网络现实应用中受到性能、计算、存储等多方面因素的限制,因此模型轻量化天然具备多目标优化的特点。现有方法由于未将计算资源、存储资源等建模为独立的多个优化目标,算法每一次运行仅可给出单个压缩模型,无法满足不同场景的差异化需求。相比于单目标优化算法,多目标优化算法可在单次求解中同时优化多个目标,并给出具有不同表现的多个Pareto最优解。基于上述分析,本文在模型剪枝框架下,建立模型轻量化的多目标评估体系,将模型轻量化问题建模为模型性能、计算资源和存储资源等多个目标引导下的优化问题,并借助人工蜂群算法、知识蒸馏、多目标免疫算法等方法求解以获得基于多目标优化的轻量化深度学习算法。具体研究内容如下:（1）设计了基于多目标聚合函数的人工蜂群剪枝算法。将模型剪枝建模为多目标聚合函数引导下的子结构搜索问题:首先将子结构进行蜜源编码,设计子结构参数共享训练算法准确度量子结构性能;接着定义分类准确率、浮点运算数和参数量三个目标,并设计了线性加权、负对数和指数衰减三种聚合函数,将三个目标聚合为一个以引导人工蜂群算法的搜索方向;最后使用编码修改个数随机生成、互补编码初始化和最优蜜源引导三个策略,提升人工蜂群算法的搜索能力,解决了基于重要性度量的剪枝算法需要人工设定度量准则的问题。在Cifar-10、Cifar-100和SVHN等数据集上进行了消融和对比实验,结果显示:该算法能够在将分类准确率损失维持在与ABCPruner、Slimmable Neural Network和Network Slimming等算法同一水平的同时,在Res Net、VGG和Mobile Net V2等模型取得最高的压缩倍率。（2）设计了基于多目标知识蒸馏的通道可扩展模型剪枝算法。传统模型轻量化方法多采用移除大规模模型中冗余参数的思路。与之相反,本节尝试构造了针对小模型的压缩算法:首先使用通道可扩展策略和动态残差块提升小模型的参数量;接着使用多目标知识蒸馏算法提高小模型性能;最后使用人工蜂群算法搜索性能提升后的小模型的结构,从而得到计算资源与原始小模型处于同一水平但性能更高的模型。在Cifar-10、Cifar-100和SVHN等数据集上进行了消融和对比实验,结果显示:该算法能够在有效提升Res Net20、VGG8和Mobile Net V2等小模型分类准确率的同时,将模型的浮点运算数和参数量控制在与原始小模型相同甚至更低的水平;相比于ABCPruner、Slimmable Neural Network和Network Slimming等移除冗余参数的方法,本算法牺牲较小压缩比以换取更高模型性能的方式更具可行性。（3）设计了基于多目标非支配近邻选择免疫的模型剪枝算法。针对模型剪枝算法应用于不同部署场景时需反复调整参数而消耗大量计算资源的缺陷,将模型轻量化建模为基于多目标优化的模型剪枝问题:首先给出以分类准确率、浮点运算数和参数量为目标的多目标模型剪枝问题的数学定义;接着改进基于非支配近邻选择的多目标免疫算法以求解多目标模型剪枝问题。设计实验分析种群规模、超变异概率和超变异长度等参数对压缩结果的影响,给出多种模型在Cifar-10、Cifar-100和SVHN等数据集上的Pareto前沿面的可视化结果。相比于ABCPruner、Slimmable Neural Network和Network Slimming等算法具有一定优势。换言之算法在给出具有同等资源压缩比、同等分类准确率的模型的同时,得到Pareto最优解集,这一特点使得本算法在不同应用需求下具有更多的选择、更高的灵活性,单次搜索即可完成模型在多个场景的部署。

其他文献

地表水处理过程中消毒副产物生成特征研究

合理利用地表水资源可缓解水资源需求,水处理工艺可优化水质,使之达到相应的水质标准。消毒是水处理过程中不可或缺的环节,能够保障水质安全。消毒后会产生一定浓度的消毒副产物（Disinfection by-produets,DBPs）,其在饮用水中会威胁到人类健康,在其他水体中会对生态环境造成一定的影响。本论文中以南水北调（邯郸段）水源水和滏阳河水源水为试验用水,研究消毒过程中不同参数对DBPs浓度的影

学位

地表水氯消毒消毒副产物消毒副产物生成势预氧化

金融科技对江苏银行小微金融产品设计与业务流程作用研究

学位

MOFs/水凝胶仿生催化体系的构筑及其抗菌应用

细胞环境中化学转化对调节生物过程和代谢途径至关重要。利用生物级联催化来生产感兴趣的化学物质已成为工业和制药领域的研究热点。特别是通过模拟细胞构建高效的级联反应系统,最近被成功的用于治疗严重威胁人们健康的细菌感染。基于此,我们合成了基于金属有机框架（Metal-organic frameworks,MOFs）/水凝胶的复合材料,从其在生物医学领域中的应用出发,设计了多种高性能的生物级联反应器,并取得

学位

水凝胶金属有机框架多室结构酶级联反应药物载体抗菌

上市公司债券违约的成因及经济后果研究 ——以贵人鸟股份有限公司为例

学位

《诗经疏义》研究

学位

长叶红砂耐镉转录组及镉转运蛋白RtCAX3功能的初步分析

盐和重金属胁迫严重制约了植物的生长发育与产量,寻找抗逆性突出的物种,研究其抗逆机制,从中挖掘优质抗逆基因资源,对土壤生物修复和抗逆品种培育意义重大。长叶红砂（Reaumuria trigyna）为柽柳科（Tamaricaceae）红砂属（Reaumuria L.）小灌木,具有极强的抗逆性,其耐盐和抗旱机制均得到了较为深入的研究,但抗重金属胁迫的能力并未得到关注,相关机理尚不清楚。针对这一问题,本论

学位

长叶红砂镉胁迫盐胁迫RtCAX3转录组

多元化经营对企业财务绩效的影响研究 ——以四川长虹为例

学位

面向非控制环境的自动抠像方法研究

近几年,能够带给人们全新的交互体验的AR技术迅速壮大。而虚拟演播间作为应用AR技术的载体之一,也在迅速发展。传统的实景演播间在场地搭建实景,根据需要布置不同的节目场景,这会耗费大量人力物力。而应用了AR技术的虚拟演播间能够在有限的空间下实现无限大场景的搭建和转换,制作成本低廉,使用方便。虚拟演播间的虚拟场景合成技术就是通过算法全自动抠像、生成背景、合成背景,可以为节目的制作提供质量高、效果好的AR

学位

绿幕抠像深度学习线性判别分析卷积神经网络随机梯度下降

面向大数据的在线Huber-支持向量回归算法的构建及应用研究

学位

融合接收端智能及网络实时应用特征的多径TCP传输决策研究

学位

基于多目标优化的轻量化深度学习技术研究

与本文相关的学术论文