论文部分内容阅读
图像目标检测是计算机视觉领域最重要,也最具有挑战性的难题之一,它为更高层次的视觉任务做准备。图像特征提取是图像目标检测的关键。卷积神经网络可以从大量图像数据中自动学习出目标检测所需的特征,避免了人工设计特征的复杂过程。并且可以适应目标平移、目标缩放、目标形变以及目标所处环境的变化。因此,基于卷积神经网络的目标检测算法正受到越来越多人的关注。但是现有的经典网络在检测多尺度目标,特别是小目标时仍然存在困难,本文针对这些问题对网络做改进,并将它应用于遥感图像飞机检测,说明本文的研究工作具有非常重要的理论研究意义和工程应用价值。本文主要研究基于卷积神经网络的目标检测技术,对Two-stage的目标检测器做改进,以提升它们对图像目标的检测效果。论文的主要工作和成果如下:1、针对卷积神经网络对小目标检测效果较差的问题。本文利用卷积神经网络不同层的多尺度特征,提出了一种构建语义金字塔特征的新方法,并用该方法构建了一个新的语义金字塔特征,目标候选区域的分类和回归都在该金字塔特征上进行,增强了算法对小目标的检测性能。2、针对传统卷积神经网络的目标候选区域特征过于简单的问题,本文利用卷积神经网络卷积层的跨层连接(Skip Connection),设计了一个新的特征提取模块,并将其放在语义金字塔特征之后,进一步提取目标候选区域的特征。实验证明,特征提取模块的加入使得目标候选区域的分类和回归更准确,提升了图像目标检测的准确率。3、由于Region Proposal Network(RPN)给出的目标候选区域与真值框之间存在偏差,使得目标候选区域经过Ro I Pooling后获得的特征只是目标自身特征的一部分,这给后续目标候选区域的分类和回归带来了困难。针对这一问题,本文提出一种名为Maxout R-CNN的目标检测方法,该方法通过丰富目标候选区域的特征,提升目标检测算法的性能。4、提出基于CNN多尺度特征融合和Maxout R-CNN的遥感图像目标检测方法。以飞机目标检测为例详细地讨论了用卷积神经网络检测遥感图像目标需要注意的问题,包括:图像的剪裁和锚的选取等。实验证明,本文提出的遥感图像目标检测方法对遥感图像的目标检测效果非常好,说明本文的研究工作不仅具有重要的理论意义也有很重要的实际应用价值。