深度卷积神经网络结构优化方法及应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:guanyinchashe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络模型性能的不断提升在很大程度上归因于深度神经网络结构的不断优化和快速发展。长期以来,大多数经典的神经网络结构都是由人类专家手工设计的,然而设计神经网络结构是一项十分耗时耗力且依赖先验知识和准则的工作。近年来,传统人工设计的神经网络结构已难以满足各种实际应用场景和性能的需求。为了解决以上问题,许多前沿的研究工作开始关注通过算法自动设计(搜索)和优化神经网络结构,以减少人力和计算资源的消耗。然而,当前自动设计和优化神经网络结构领域还处于发展初期,仍存在许多瓶颈问题:比如搜索算法效率低,消耗计算资源多,可迁移性差等。针对这些问题,本文的主要研究工作围绕深度卷积神经网络结构的优化方法展开,从神经网络结构搜索和神经网络模型剪枝两个方面着手进行了一系列方法及其应用研究,并取得了以下研究成果:(1)针对可微分神经网络结构搜索方法中存在的问题和局限性,包括搜索空间灵活性较差、模型崩溃现象、搜索-评估相关性低等,本文从搜索空间和搜索策略上分析了这些问题产生的原因,并提出了基于可微分退火和动态剪枝的神经网络结构搜索框架。该框架首先改进了基于单元格的局部搜索空间,设计了一种弹性密集连接的全局搜索空间,它将结构的深度表征权重与候选操作的权重解耦,避免了跳跃连接聚集的现象。然后使用了基于组退火和阈值剪枝的渐进式搜索策略,该策略能够使结构参数随着搜索的进行而逐渐逼近二元分布,而权重较低的劣势操作被逐步剪枝,提高了搜索过程的稳定性并减少了搜索时间代价。为了提高搜索结构的计算资源适应能力,本文提出了一种基于动态规划的通道剪枝方法,它通过在搜索过程中逐步修剪冗余通道,使得最终的网络结构能够严格地满足给定的资源约束。(2)针对基于单次训练的结构搜索框架中存在的难点和关键问题,比如超网络的训练过程不稳定、训练效率较低、单路径搜索空间中的最优子结构性能较低等,本文提出了一个统一的基于多路径训练的神经网络结构搜索方法。该方法采用了二阶段的基于单次训练的结构搜索框架,将超网络训练与子网络结构搜索分离成两个独立的步骤,具有良好的灵活性和通用性。然后本文改进了超网络中批标准化层的结构,提出了一种混合批标准化层结构,使之适用于多路径超网络的训练,提高了训练过程的有效性和稳定性。为了提高超网络训练效率,本文提出了基于多样性分数的搜索空间收缩策略,该策略通过引导超网络在训练期间逐步淘汰劣势的候选操作组合,从而逐步减小搜索空间,提高了搜索效率和最终网络结构的性能。(3)针对二阶段的基于单次训练的结构搜索框架中存在的另外一个关键问题,即在权重共享的策略下,子网络结构性能的真实排序往往并未得到很好的保留,从而将误导搜索过程中的子网络性能评估,使其难以有效地搜索到高精度的子网络结构。本文首先分析了超网络的训练过程,并将这种现象出现的原因归结于超网络训练过程中的一致性偏移,包括特征偏移和参数偏移。然后提出了一种基于一致性损失和时序集成的神经网络结构搜索框架,该框架构建了两个超网络结构,即教师超网络和学生超网络,通过引入基于交叉路径学习的一致性损失函数,有效地提高了超网络的泛化能力,减少了特征偏移现象。此外,教师超网络的权重是通过计算学生超网络的滑动平均值更新的,集成了历史权重信息,因此能够有效地减少超网络训练过程中的参数偏移现象,提高超网络训练过程的稳定性。(4)针对传统神经网络剪枝方法存在的问题和局限性,包括人工设计重要性评价指标时间成本高、可扩展性差,迭代式模型剪枝计算复杂度高、效率低等,结合神经网络结构搜索的思想,本文提出了基于权重共享和进化算法的自动化剪枝框架,该框架通过通道分组和随机通道采样的方式训练了一个可伸缩的超网络,该超网络中不同通道配置的子网络可以直接继承对应的权重,无需重新训练即可评估不同宽度的子网络精度,从而避免了迭代剪枝和评估通道重要性的步骤,提高了剪枝效率。在此基础上,本文使用多目标进化搜索方法实现了自动化剪枝,使得剪枝网络能够在分类精度和资源消耗(如参数量、FLOPs、推理时延等)之间实现即时的平衡。(5)在以上提出的卷积神经网络结构搜索和模型剪枝方法的基础上,本文进一步将这些方法推广应用到了真实场景中的图像识别任务。具体来说,本文研究了如何自动设计遥感图像识别任务中的骨干网络结构,探索了神经网络结构优化方法如何在实际应用场景中发挥作用并产生影响。为了突破基于自然图像设计的骨干网络在遥感图像识别任务中的性能瓶颈,并将神经网络结构搜索方法应用于遥感图像识别任务,本文提出了遥感图像识别任务中骨干网络结构的新设计范式,构建了基于单次训练和权重共享的神经网络结构搜索框架,该框架包含超网络预训练、微调训练和骨干网络结构搜索三个阶段,同时结合了前文提出的超网络训练策略,提高了训练稳定性和最优骨干网络的性能,并能够迁移到不同的遥感图像识别任务。另外,本文还通过合并多个公开的遥感图像数据集构建了一个大规模数据集,缓解了预训练数据量不足的问题并提高了超网络在遥感图像数据上的泛化能力。
其他文献
聚类是在没有类标签等先验知识的前提下根据数据内部特征对数据集进行类别划分,旨在发现新的结构、新的性质和新的关系。随着信息技术的发展,聚类分析的应用领域越来越多。与此同时数据的复杂度也在不断增大(数据集中各子集的形状多样,既有凸数据子集也有非凸数据子集,数据集中类的大小相差较大,以及数据分布疏密程度相差较大等情况),以至于许多现有的聚类算法聚类效果不佳,究其原因,主要是因为以下问题:1)类的数目难以
学位
卫星收集有关地球的极其重要的数据,并将这些数据用于环境监测、天气预报、制图等应用。虽然卫星在许多领域应用广泛,但它们的开发和运行成本很高,因此需要最大限度地利用从可访问卫星获取的数据。将卫星上来自多个传感器获取的低分辨数据进行融合处理,将有望合成出高分辨数据,有效降低高分辨数据获取的成本。例如,全色图像一般具有较高空间分辨率,但仅有一个波段,缺失光谱信息,而多光谱图像可以获取相对丰富观测场景的光谱
学位
随着互联网技术、云计算技术的发展,人工智能技术迎来了蓬勃发展的机会。粒计算作为人工智能领域里面一种新兴的研究方法引起了研究者的关注。从大量的数据里面挖掘出潜在的对人有用信息,对传统的数据挖掘方法具有挑战性。粒计算技术针对复杂的数据结构从不同层面构建信息粒,使人们可以从不同角度对数据进行解读。信息粒更符合人类对物理世界的认识,不同粒度的信息粒可以帮助人类加深对研究对象本质的理解。构建适合的信息粒是粒
学位
在国家“碳中和”和“碳达峰”战略背景下,太阳能电池作为一种将太阳能转换为电能的光电器件近年来发展迅速。晶硅太阳能电池作为现在光伏市场的主流产品,经过数十年的发展其光电转换效率已超过26%,非常接近29.4%的肖特基-奎伊瑟理论光电转换效率极限,想要取得进一步发展已经非常困难。因此,人们将目光转向了新型太阳能光伏电池的研发。其中,钙钛矿太阳能电池因为具有制备工艺简单、制备成本低廉、较高的光吸收系数,
学位
异常检测是指挖掘与探测样本集中与正常样本分布存在明显差异的样本。在高光谱遥感领域,高光谱图像细粒度的光谱特征为精细化的地物目标检测与识别提供了可靠的支持。基于高光谱遥感图像的异常检测技术在军事、农业、矿业等诸多领域有着非常重要的应用价值。但是,由于缺乏异常样本相关的先验知识,极大地增加了高光谱图像异常检测任务的挑战性。因此,如何设计有效的高光谱图像异常检测算法,是高光谱图像解译与应用亟需解决的关键
学位
多年来,电磁辐射源和探测器的发展对各种科学研究都至关重要。然而,对于介于微波与红外之间的频率为0.1~10 THz的太赫兹电磁波一直缺乏有效的电磁波产生源和灵敏的探测器。因此,能够弥合这一空隙的紧凑且相干的太赫兹源将开启通信、传感和成像领域的无数应用。基于量子共振隧穿效应的共振隧穿二极管(Resonant Tunneling Diodes,缩写为RTD)以其结构紧凑、室温工作、覆盖频率较宽及利用少
学位
碳化硅(SiC)以其宽禁带、高热导率和高电子饱和漂移速度等出色的材料特性,不仅功率半导体器件领域大放异彩,同时在300°C以上的高温电子领域具有非凡的潜力。SiC结型栅场效应晶体管(JFET)作为PN结构成的电压控制器件,具有高温可靠性高,输入阻抗大,对输入信号的变化更为敏感的优势,非常适合应用于高温模拟放大电路。本研究围绕高温模拟放大电路的应用需求,开展4H-SiC横向JFET(以下简称JFET
学位
近年来,随着集成电路特征尺寸持续缩小,以硅等传统半导体材料为基础的集成电路制造技术,正面临着短沟道效应、光刻衍射极限、统计不确定性等诸多挑战。后摩尔时代集成电路的持续发展,需要着力于新原理、新材料、新工艺和新结构器件等技术的创新和突破,在芯片尺寸、能耗比和计算效率等性能上得到进一步提升。与此同时,全球环境污染日益严重、极端气候事件频发、能源短缺日益严峻,世界经济从化石燃料经济向低碳甚至零碳经济的转
学位
极化合成孔径雷达(SAR)具有多频段、多极化、全天时、全气候的主动成像特点,能够获得更丰富完整的地物目标散射信息。极化SAR图像分类作为遥感图像解译研究中的重要组成部分,旨在根据图像中分类单元的散射特性,对其赋予地物类别标记。研究行之有效的分类算法有助于挖掘极化SAR图像中的判别信息,以提高对地物目标的识别能力,从而推动极化SAR在实际工程中的广泛应用。本论文依次以单频段极化SAR图像与多频段极化
学位
太赫兹频段由于其优异的电磁波特性,包括光谱分辨能力、穿透成像和宽带等优势在军事安全通信和民用成像探测领域展现出广阔的应用前景,成为近年来全球前沿科研的热点研究对象。目前在太赫兹辐射源中,IMPATT器件由于高功率输出逐渐成为研究热门,被广泛应用与军民两用领域,如通信、雷达等系统中。基于Si和GaAs材料的器件由于材料的物理条件限制在应用过程中逐渐展现弊端,无法在高温、高频大功率、抗辐射、光电子器件
学位