论文部分内容阅读
物体检测是计算机视觉领域的基础问题之一。随着深度学习的兴起,目前的主流方法多基于有监督学习。然而,有监督学习的物体检测在其训练数据制备阶段需要坐标级别的标注,这往往耗时、耗力。因此,有监督学习的物体检测在实际应用中受到标注成本过高的限制。弱监督学习的物体检测旨在使用简单的图像级别标注训练检测模型。
本文研究基于卷积神经网络的弱监督物体检测方法,采用先分类后检测的框架。在分类部分,本文主要研究了卷积神经网络在图像分类任务上的工作原理,并提出了两种提高分类准确率的方法。在检测部分,本文在分类卷积神经网络的基础上,针对大目标物体和小目标物体分别提出了两种弱监督物体检测方法。本文具体的创新点如下:
1、训练集类别不平衡会导致训练出的分类器失准。针对该问题,本文提出了利用迁移学习提高网络分类能力的思路。在目标域训练样本(即原始数据)不能扩充的情况下,本文通过构建大规模源域数据集(即合成数据),用卷积神经网络训练微调的方式提高了分类网络对目标域数据的分类准确率。
2、传统的卷积神经网络通常采用单层次的处理方式实现图像的分类,这会导致相似类别容易混淆。针对该问题,本文通过引入标签树和贝叶斯理论,提出了一种多层次分类的卷积神经网络结构:coarse-to-fine CNN。实验证明,coarse-to-fine CNN在分类性能上优于传统卷积神经网络。相比于其他多层次分类的卷积神经网络模型(HD-CNN、B-CNN),本文网络在改造传统卷积神经网络时需要的额外参数更少。
3、分类卷积神经网络的高层特征携带着大量语义信息,但语义信息抽象且复杂。针对该问题,本文使用泰勒定理推导提出了sGrad-CAM+方法,能在高层特征中提取图像物体的位置信息,从而完成检测。实验表明,本文方法较以前方法(Grad-CAM)可以得到更准确、更稳定的物体检测效果。
4、小目标物体缺乏高层特征,难以检测。针对该问题,本文提出了基于梯度显著图的弱监督物体检测方法,能有效地检测小目标物体。通过引入感受野和预测差,本文实现了对梯度显著图的有效性验证。实验表明,梯度显著图具有显著的抗复杂背景干扰能力,能够辅助经验特征更好地检测到小目标物体。
本文研究基于卷积神经网络的弱监督物体检测方法,采用先分类后检测的框架。在分类部分,本文主要研究了卷积神经网络在图像分类任务上的工作原理,并提出了两种提高分类准确率的方法。在检测部分,本文在分类卷积神经网络的基础上,针对大目标物体和小目标物体分别提出了两种弱监督物体检测方法。本文具体的创新点如下:
1、训练集类别不平衡会导致训练出的分类器失准。针对该问题,本文提出了利用迁移学习提高网络分类能力的思路。在目标域训练样本(即原始数据)不能扩充的情况下,本文通过构建大规模源域数据集(即合成数据),用卷积神经网络训练微调的方式提高了分类网络对目标域数据的分类准确率。
2、传统的卷积神经网络通常采用单层次的处理方式实现图像的分类,这会导致相似类别容易混淆。针对该问题,本文通过引入标签树和贝叶斯理论,提出了一种多层次分类的卷积神经网络结构:coarse-to-fine CNN。实验证明,coarse-to-fine CNN在分类性能上优于传统卷积神经网络。相比于其他多层次分类的卷积神经网络模型(HD-CNN、B-CNN),本文网络在改造传统卷积神经网络时需要的额外参数更少。
3、分类卷积神经网络的高层特征携带着大量语义信息,但语义信息抽象且复杂。针对该问题,本文使用泰勒定理推导提出了sGrad-CAM+方法,能在高层特征中提取图像物体的位置信息,从而完成检测。实验表明,本文方法较以前方法(Grad-CAM)可以得到更准确、更稳定的物体检测效果。
4、小目标物体缺乏高层特征,难以检测。针对该问题,本文提出了基于梯度显著图的弱监督物体检测方法,能有效地检测小目标物体。通过引入感受野和预测差,本文实现了对梯度显著图的有效性验证。实验表明,梯度显著图具有显著的抗复杂背景干扰能力,能够辅助经验特征更好地检测到小目标物体。