基于进化多目标优化的神经网络压缩学习

来源 :深圳大学 | 被引量 : 0次 | 上传用户:naonao6521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型压缩与优化是当下深度学习领域的研究热点之一,致力于解决深度神经网络(Deep Neural Network,DNN)模型过度冗余,参数过大导致的运算量或存储要求过高的问题。当前主流的基于低秩与稀疏分解的网络压缩方法没有整体考虑权重的这两种特性,忽略了它们之间的关联。其次,模型压缩涉及的超参数,如秩、稀疏度等的搜索空间极大,高度依赖领域专家经验进行选择。此外,在稀疏网络的学习中,网络连接结构与模型参数作为保证压缩性能的关键,往往难以得到较理想的设置与训练。大量试错过程不仅浪费人力成本,也会造成严重的计算负担,且最后只能找到单一的所谓“最优解”,无法满足用户对不同场景下模型压缩效果的需求。因此可见,在DNN模型压缩学习与优化方面,仍有较多亟待解决的问题。准确捕获权重的结构特征,设计合理并高效的压缩学习算法,是一个富有挑战性的科学难题。本论文深入分析网络权重的低秩与稀疏特性,提出新型的压缩结构,并基于进化多目标优化(Evolutionary Multi-objective Optimization,EMO)的思想,解决该类DNN模型压缩所涉及的超参数难调,搜索难度高等难题。同时也基于该思路,对稀疏神经网络连接结构与参数训练过程进行优化。主要工作分以下几个方面:1)巧妙结合神经网络权重的低秩与稀疏特性,提出一个联合分解的压缩结构。在矩阵低秩分解之后,对低秩矩阵嵌入稀疏化操作,同时加上全局的稀疏矩阵作为性能补偿,实现网络的深度压缩。该方案采取端到端的一步分解与重训练操作,不增加额外的迭代优化,实验证明该压缩结构在一些经典网络模型上能取得不错的效果。2)将1)中的压缩学习问题构建为以压缩率和模型分类错误率为目标的多目标优化问题(Multi-objective Optimization Problem,MOP),设计高效的多目标进化算法(Multi-Objective Evolutionary algorithm,MOEA),求解该DNN模型压缩学习问题。算法构造了快速的子代压缩模型生成方法,并针对模型进化过程中复杂的子代评估过程,采取重训练前的测试结果作为代理适应度,结合非支配排序和基于?1范数的距离度量准则做候选模型的早期筛选,节省大量子代生成与评估时间。该模型可以搜索出每层网络合适的秩与稀疏度,并最终得到分布均匀的帕累托最优(Pareto Optimal)压缩模型集合,满足用户在不同条件下对压缩效果的要求。3)针对稀疏连接神经网络,提出了一种基于梯度与进化算法的多目标联合稀疏网络训练方法,通过模型早期训练阶段挖掘出稀疏特性,并设计分别用于网络稀疏结构搜索与参数调整的多目标进化算法,网络整体训练采用梯度更新与进化算法交替优化方式,最终实现更优的稀疏网络模型。
其他文献
锗(Ge)与锡(Sn)同为IV族元素,其合金(Ge1-xSnx)具有与硅(Si)一样的金刚石结构。特别的是,理论上预测当Sn含量达到6%-11%时,锗锡合金的能带将会从间接带隙转变为直接带隙,这对于实现高效率、低成本的硅基光电子芯片具有重要的意义。但是由于Sn在Ge中的溶解度仅有1%,且晶格失配度较大(14.7%),制备具有高锡含量的锗锡合金薄膜仍然充满了挑战,对于锗锡合金能带结构的调控及其机理研
随着创新创业成为驱动经济发展的新引擎,众创空间顺理成章的成为了中国未来经济发展的重要实践载体,在去过剩产能、盘活城市存量不动产和为创新经济发展降低成本等方面发挥了巨大作用。近年来,政府不断推出一系列鼓励“大众创业,万众创新”的政策,全国各地创业热情高涨,陆陆续续建设了一大批众创空间。随着众创空间的深入发展,其中很多众创空间单纯靠“二房东”收租,缺乏可持久运营的商业模式难以维持生计,众创空间领域开始
在我国众多少数民族中,苗族是一个富有古老文明的民族,可以追溯到距今五六千年前的炎黄传说时代,在历史发展的过程中,优秀的民族文化得以保存,为民族文化创意产业的发展提供了取之不尽的宝贵资源。贵州黔东南是苗族人民最聚集的地方,近十几年在国家大力发展旅游业的政策下,贵州黔东南被更多外界人士知晓,丰富的苗族地域文化得到了广泛的传播。文化创意产品是指文化与创意结合创作出来的载体形式之一,在当今经济蓬勃发展的时
我国经济进入高速发展阶段,在居民的物质生活水平得到稳步提升的同时大众对于精神文化的需求也在不断增长。因此,能为大众提供集中性的文化娱乐产品体验及服务的建筑——城市文化综合体应运而生并逐渐融入大众的生活当中。在城市文化综合体内由个体经营的具有特色、风格、文化等特征,涵盖餐饮、画展、讲座、音乐、文创产品等为一体复合式经营的独立书店,满足消费者阅读、餐饮、逛游、休息等物质需求与精神需求相结合的多元化经营
当前人们对海洋资源的探索和开发与日俱增,水下机器人技术也随之飞速发展。为了更优越的性能,人们加大了对仿生机器人的研究,仿生机器海豚已成为当今的研究热点之一。机器海豚可以在许多领域发挥着重要的作用,比如资源探测、泄露检测、水质检测、军事探索和攻击等。目前多数的机器海豚是采用地面站进行控制运动的,但是现阶段水下无线通信技术多数存在着一定的延迟,难以实时传输数据和控制指令。为了使机器海豚能够自主游动,可
仿生系列智能机器人发展以来,主要分为陆地机器人、水下机器人和空中飞行无人机三大类。其中无人机与陆地机器人发展迅速,而水下机器人有几大研究所进行研究,并因在水下水质质量检测、水下空间构建、生态数据采集、军事信息传输等一系列工程应用得以加重关注。现有研究的水下仿生机器人推进方式主要以身体/尾鳍(body and/or Caudal Fin,BCF)和中央鳍/对鳍(Median and/or Paire
图像隐写术是多媒体安全领域中的一种常用技术,它主要通过对图像载体的像素值或DCT系数的轻微修改来嵌入秘密信息。随着图像隐写术的发展,隐写分析术的目的则是检测图像中是否存在秘密信息。隐写和隐写分析一直在对抗博弈中共同发展,基于最小失真框架的隐写和基于有监督学习的隐写分析成为主流的研究方法。为了提高隐写的安全性能,图像内容自适应隐写算法将修改集中到隐写分析器难以建模的纹理复杂区域。随着深度学习技术在图
二维码由于其成本低和使用方便等特性,得到了广泛应用。为了抵抗非法复制(Illegitimately-Copying,IC)攻击,现有的防复制二维码通过隐藏认证信息来提高其安全性,如最新提出的:2LQR二维码(Two-Level QR code)、LCAC二维码(Low-Cost Anti-Copying 2D barcode)和STAC二维码(Superimposed-Tag Anti-Copyi
随着高效的视频编码技术和计算机网络的普及,数字视频已经渗透到人们生活的方方面面。视频一方面作为娱乐产品丰富人们生活,另一方面在司法取证和公共安全中也扮演着重要的角色。视频处理技术的发展和视频编辑软件的涌现,使得普通用户轻易就可以完成视频内容的修改。不法分子通过篡改视频内容达到造谣、嫁祸他人目的的案例越来越多。因此视频原始性取证分析技术对个人权益和社会的稳定都具有重要的作用。本文针对视频原始性证实的
深度学习近年来得到了快速的发展,在计算机视觉,自然语言处理等众多领域有着优越的表现,催生了一系列智能产品的落地。而深度学习的本质是在大数据支撑下,由多层神经网络堆叠形成的信号处理系统,具有参数量大,计算复杂度高等特点,需要依靠高性能的服务器端来处理庞大的网络参数运算与更新。很多时候,出于响应时间、隐私方面和服务稳定性的考虑,更希望将这些网络模型放在移动终端上运行,而移动终端的运算资源及计算能力有限