目标检测网络的模型轻量化和剪枝算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:deterly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会对于智能视觉技术的需求越来越强,也推动了计算机视觉技术的高速发展,高速发展的视觉技术也在反哺社会,新时代的社会发展离不开计算机视觉技术。目标检测是计算机视觉技术的一个分支,其已经应用在工业、医学、交通、安全、军事等各个领域,取得了良好的效果。其能够使社会生活更加便利,能够帮助各行各业处理各种视觉任务,节约成本。当前目标检测领域的研究重点集中在提高目标检测技术的检测精度,检测速度以及更简易的部署。然而多数的目标检测网络模型泛化能力差,在通识目标的识别上精度不高,在移动端和嵌入式设备上部署困难。本文围绕着轻量级目标检测网络所面临的挑战,以提高目标检测模型的精度和更轻量化的目标检测模型为出发点,开展基于深度学习的轻量级目标检测技术的研究。研究内容包括,基于聚类的Anchor参数生成算法,基于多尺度融合的轻量级网络模型,基于L1正则的结构化网络剪枝方法。具体的研究内容及贡献如下:1.针对当前Anchor超参数设定精确不够,过渡依赖人工设定的问题,提出了新的基于聚类的Anchor生成算法,该方法通过对真实数据集中目标框的处理,生成更适合该数据集的Anchor框尺寸。实验结果证明了该方法能够提高目标检测网络的检测精度。同时,该方法具有良好的可移植性,可以在多个基于Anchor的目标检测网络模型中使用。2.针对多数目标检测网络模型复杂度过高,参数过多,难以在实际应用中部署到移动端或嵌入式相关设备中的问题,从模型轻量化设计的角度出发,提出了一个轻量级目标检测网络模型,该方法结合了本文提出的Anchor算法,充分结合了图像上下文信息,同时,用更深的网络结构替代更宽的网络结构。通过实验证明该方法在轻量级的目标检测网络模型中具有优势,在MS-COCO2014数据集上能够取得20.9%的精度。3.针对大型网络模型精度高,但是模型复杂,速度慢,难以部署到实际应用设备中的问题。提出了一个基于L1正则范式的结构化网络剪枝方法,该方法可以对已经训练完成的网络进行单层或跨多层的网络剪枝,去掉其中冗余的层。通过实验可以发现该方法能够在基本保持目标检测网络模型精度的同时,大幅降低网络模型的复杂度,该方法在对本文提出的网络模型的剪枝率达到47.33%,对图像分类网络VGG-16的剪枝率达到了28.61%,证明了其使用价值。
其他文献
近年来,高超声速飞行器在空天技术领域取得了突破性的发展,以其独特的优势成为世界关注的焦点。高超声速飞行器具有高空高速以及高机动能力的特点,面向未来空天作战和商业应用,基于高超声速飞行的智能化具有极其重要的意义。路径规划是高超声速飞行器执行飞行任务的重要技术,特别是需要面对来自地面或空间的未知威胁。飞行器路径规划的目的是在机动性能、敌人威胁和飞行时间等多约束条件下,寻找最优或次优路径以有效规避威胁。
近年来空天地一体化网络(Space-air-ground Integrated Network,SAGIN)受到了越来越多学术界和工业界学者的关注。空天地一体化网络具有显著优点:卫星网络覆盖范围广、空中网络灵活性强、地面网络资源丰富,SAGIN能有机结合不同层面网络优势,在地面监控测绘、导航制导、军事作战等各个领域发挥重大作用。针对上述问题,本文以软件定义网络(Software Defined N
本文研究一类奇异微分方程和一类全非线性奇异椭圆方程的正则性问题。第一部分我们研究的是一类奇异微分方程。首先我们运用比较原理和伸缩论证得到方程解的增长性估计和解在边界点附近的性质;然后我们引入了一个迭代,运用这个迭代和归纳法我们得到了方程解的正则性估计;最后把我们的论证方法推广到了一类含参奇异微分方程,并得到相应的正则性结论。第二部分我们把第一部分得到的奇异微分方程和含参奇异微分方程解的正则性理论分
随着人们对海洋资源与开发的日益重视,成像声纳不断发展,包含的数据量急剧增加,同时由于水下环境的错综复杂导致声纳图像受到多种不同类型复杂严重的噪声影响,优秀的声纳图像去噪算法计算复杂、耗时长,难以满足应用场合的实时性要求。而GPU具有大量计算单元,在大规模数据计算、处理速度等方面的性能大大超过CPU,表现出巨大的优势和潜力,利用GPU来进行声纳图像去噪并行加速研究,具备良好的可行性和工程应用价值,可
有机硅改性聚氨酯胶粘剂能够结合二者的性能优势,利用有机硅提高聚氨酯的耐水、耐热和耐候等性能。本文综述了聚氨酯胶粘剂的各种类型、有机硅改性聚氨酯胶粘剂的方法和研究进展,包括硅烷偶联剂和硅氧烷低聚物两种改性方法,并对比了不同有机硅改性的优缺点。
近年来,随着信息化时代的飞速推进,各行业涉及到的数据越来越复杂,数据规模也越来越大,比如超清彩图,视频,交通信息,遥感数据等。对于这些高维数据,我们将其称为张量。然而,在张量的采集传输过程中,受到各方面因素的影响,数据丢失问题不可避免。如何从已知数据推测出未知部分的信息对于后续应用至关重要。这个任务我们称之为张量补全。由于现实世界中,大部分数据都是低秩的,这个问题也被称为低秩张量补全。本文主要研究
近年来,围绕飞行器的应用方式越来越丰富,其应用领域更多,任务也更繁杂,单一飞行器已不足以供应所有需求。飞行器集群化可以满足扩张后的作业需求,提供更加复杂的功能服务,集群作业依赖精确及时的导航定位,因此迫切需要研究与设计高性能的集群协同导航系统。目前该技术研究仍在萌芽期,研究大多仅考虑到集群化数量、导航精度、定位成本以及自主性等方面中的一两个,没有给出一个较全面的统一通用的集群协同导航方法和仿真环境
假设一量子系统可能是N个状态之一,如何通过量子力学允许的方法来确定这一系统即为所谓的量子态分辨问题。在许多量子计算和量子信息处理过程中,都需要用到量子态分辨。因此,近年来,量子态分辨得到了广泛的研究。另一方面,量子纠缠在量子计算和量子信息中扮演着重要的角色,可以实现经典计算和经典信息论中不能实现的任务。最近的研究认为量子关联是比量子纠缠更广泛的一种量子非局域性,并且能够作为解释某些量子算法加速的原
粒子物理学标准模型(SM)自20世纪60年代末期建立以来在长达40年的实验检验之下,已被证实是一个极其精确的理论。标准模型描述所有已知基本粒子的相互作用,包括物质粒子(三代夸克和轻子)、传递电弱强三种相互作用的规范玻色子、以及产生所有基本粒子质量的Higgs玻色子。然而标准模型仍然遭受一系列基本的理论疑难(例如,无法描述引力作用、精细调节问题、平庸性问题、真空稳定性问题、太多任意参数问题等等),使
近年来,随着人工智能的高速发展,各种智能应用和设备广泛出现,一些传统的生产生活方式被替代,但随之带来的是人工智能安全问题。造假图像和音频的出现、对抗性样本攻击的出现,都对人工智能系统产生巨大的威胁。可信AI,作为目前被广泛关注的研究热点,通过各种防御和容错技术,使得人工智能系统不再轻易被攻击。本论文针对语音方面的攻击手段提出相应的容错方法,提高语音识别系统的鲁棒性。目前语音攻击方法主要有三种,语音