基于卷积神经网络的弱监督物体检测方法研究

来源 :国防科技大学 | 被引量 : 2次 | 上传用户:chen17981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测是计算机视觉领域的基础问题之一。随着深度学习的兴起,目前的主流方法多基于有监督学习。然而,有监督学习的物体检测在其训练数据制备阶段需要坐标级别的标注,这往往耗时、耗力。因此,有监督学习的物体检测在实际应用中受到标注成本过高的限制。弱监督学习的物体检测旨在使用简单的图像级别标注训练检测模型。
  本文研究基于卷积神经网络的弱监督物体检测方法,采用先分类后检测的框架。在分类部分,本文主要研究了卷积神经网络在图像分类任务上的工作原理,并提出了两种提高分类准确率的方法。在检测部分,本文在分类卷积神经网络的基础上,针对大目标物体和小目标物体分别提出了两种弱监督物体检测方法。本文具体的创新点如下:
  1、训练集类别不平衡会导致训练出的分类器失准。针对该问题,本文提出了利用迁移学习提高网络分类能力的思路。在目标域训练样本(即原始数据)不能扩充的情况下,本文通过构建大规模源域数据集(即合成数据),用卷积神经网络训练微调的方式提高了分类网络对目标域数据的分类准确率。
  2、传统的卷积神经网络通常采用单层次的处理方式实现图像的分类,这会导致相似类别容易混淆。针对该问题,本文通过引入标签树和贝叶斯理论,提出了一种多层次分类的卷积神经网络结构:coarse-to-fine CNN。实验证明,coarse-to-fine CNN在分类性能上优于传统卷积神经网络。相比于其他多层次分类的卷积神经网络模型(HD-CNN、B-CNN),本文网络在改造传统卷积神经网络时需要的额外参数更少。
  3、分类卷积神经网络的高层特征携带着大量语义信息,但语义信息抽象且复杂。针对该问题,本文使用泰勒定理推导提出了sGrad-CAM+方法,能在高层特征中提取图像物体的位置信息,从而完成检测。实验表明,本文方法较以前方法(Grad-CAM)可以得到更准确、更稳定的物体检测效果。
  4、小目标物体缺乏高层特征,难以检测。针对该问题,本文提出了基于梯度显著图的弱监督物体检测方法,能有效地检测小目标物体。通过引入感受野和预测差,本文实现了对梯度显著图的有效性验证。实验表明,梯度显著图具有显著的抗复杂背景干扰能力,能够辅助经验特征更好地检测到小目标物体。
其他文献
该文以两个三角的语法理论为研究思路,以共时比较、历时比较为理论指导,对"V也VP"结构从历时和平时两个平面进行了考察.全文主要有五个部分:一"V也VP"结构的历时考察这一部分从历时平面考察"V也VP"结构的产生时代和发展概况,并从它的产生背景、产生条件、产生来源、产生过程四个方面进行探讨.二"V也VP"结构的共时考察这一部分描写"V也VP"结构的句法特点、句法功能,并对构成"V也VP"结构的成分"
学位
流行病学研究发现可吸入颗粒物(PM10,粒径<10μm的颗粒物)浓度的升高与死亡风险的增加(包括呼吸系统疾病和心血管疾病)显著相关。由于教师和学生的呼吸系统疾病发病率明显高于其它职业人群,因此分析教室颗粒物化学成分特性和散发来源,对于控制污染源散发量,降低教室颗粒物浓度和毒性十分重要。本文通过研究教室内外颗粒物PM10的化学组分特性和来源特性,总结教室环境颗粒物PM10的污染特性。实验采用TEOM
学位
同步发电机励磁控制系统对于电力系统的安全稳定运行有着重要影响。作为励磁控制系统的主要环节之一,励磁调差单元可以有效改善发电机的电压调节特性,但也会对发电机的稳定运行产生一定影响,合理地整定励磁调差系数有利于改善发电机阻尼,提高电力系统的动态稳定性。  首先,基于戴维南定理建立发电机并网时等效电路模型,采用等效电路的相量图讨论了励磁电流变化时,发电机电势、机端电压以及功角之间的变化关系。在此基础上,
从传统意义上来说,焊接质量是通过稳定焊接工艺参数和焊后检验来保证的。但是,由于焊接过程存在大量随机影响因素,因此,仅仅通过稳定工艺参数无法完全避免焊接缺陷的产生。此外,焊后检验作为质量保证体系虽必不可少,但其不具实时性,不能及时发现焊接缺陷。随着对电弧认识的不断深入和现代测试技术的逐步发展,从作为各种电弧物理现象信息载体的电弧电压,以及焊接电流信号中提取与焊接过程质量相关的特征信息,便可实现对质量
混沌现象广泛存在于客观世界中,对混沌现象的认识是非线性科学最重要的成就之一。混沌以其拥有的诸多天然优良特性而备受关注,并在很多领域得到了广泛和成功的应用。通过对混沌系统的分析研究,可以更好的把握混沌的特性,为应用混沌打下坚实的理论基础。随着对混沌现象研究的不断深入,混沌在保密通信中的应用已成为这一领域的前沿课题。本文对混沌理论及其在保密通信中的应用进行了深入的研究。具体如下:(1)本文首先系统的介
该文首先概括介绍了硅中Ga扩散的原理以及SiO-Si内界面的结构与特性,简要叙述硅中Ga掺杂的研究现状.第二章介绍进行开管Ga扩散所用的氧化和扩散系统、样品制备过程及其分凝特性的测量.第三章系统研究了不同条件下Ga在SiO-Si内界面的分凝特性.借助SIMS分析方法,研究并得出了Ga在SiO/Si系恒定表面源条件下的掺杂规律.通过对磷扩散过程的模拟分析,得到近基区载流子浓度随磷再分布时间变化的三段
学位
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像技术可获取非合作目标的一维、二维甚至三维图像,是空天目标监视识别的重要手段。目标图像的分辨率与雷达系统带宽成反比,而现有的宽带雷达带宽有限,无法提供对空天小目标监视识别所需的高分辨率图像。为提高目标图像分辨率,本文对空天目标精细成像方法进行了深入研究,以期在现有条件下提高图像分辨率,为我国空天目标监视提
现代战场通信采用组网的方式实施,信息注入已成为一种有效的战场无线网络对抗手段。通信网链路层协议的破析是实施信息注入的前提条件之一,信道编码识别又是链路层协议破析的关键技术。在认知无线电领域,自适应编码调制(Automatic Modulation Coding,AMC)技术被广泛采用,当编码调制参数信息不能准确及时地发送到接收端时,接收方需要快速地识别出信道编码方式及参数,以便于及时获取发送的信息
学位
卫星导航定位系统被广泛应用于车辆地面导航以及航空航天等领域。但是在室内或建筑物密集区,卫星信号由于受到墙体遮挡衰弱比较严重,导致卫星导航定位存在较大盲区。基于微惯导人员自主定位技术由于不需要预先在建筑物内部安装设施且无需外部信息即可实现自主定位,已成为室内定位领域的研究热点。针对目前微惯导室内定位技术中存在的定位误差累积和陀螺仪航向漂移等关键技术问题,本文重点研究了自适应零速检测方法、陀螺仪航向漂
多目标优化问题在现实生活中普遍存在。与单目标优化存在唯一最优解不同的是,多目标优化问题的解由一系列相互折衷的Pareto最优解组成。“寻优”和“决策”是求解多目标优化问题的两个关键要素。进化多目标优化,旨在利用基于种群的启发式算法一次求出所有的Pareto最优解,关注于“寻优”;多准则决策,旨在通过偏好建模帮助决策者找到最满意的Pareto最优解,关注于“决策”。基于偏好的进化多目标优化,是进化多