论文部分内容阅读
目标检测技术在光电观测、自动驾驶和生物医疗等领域有着巨大的应用潜力,目前已经在这些领域的某些场景下发挥着重要作用,同时也是计算机视觉的核心和基础。其中,分辨率在(0,32]范围内的小目标检测不论是在军事还是民用领域都有极大的应用价值。传统的目标检测算法需要根据特定的应用场景来选择检测窗口、手工设计特征然后训练分类器分类三个步骤,过程复杂且模型泛化能力差,而且小目标通常缺乏纹理特征,手工提取的特征维数低,鲁棒性差,容易造成分类器过拟合。随着深度学习技术的发展,深度卷积神经网络在目标检测领域取得了令人难以置信的成绩,形成了基于区域的双阶段检测和基于回归的单阶段检测两种主流的检测思路,产生了很多优秀的算法,例如R-CNN、Faster R-CNN以及SSD等。但是由于检测的背景复杂、遮挡以及分辨率低等问题,对小目标检测造成了极大的挑战。目标检测可分为目标定位和识别两个步骤,即先找到感兴趣目标位置,再识别目标的类别。本文分析基于深度学习的经典目标检测算法后,选择基于区域的双阶段检测思路,分别在目标定位阶段和目标分类阶段提出了针对小目标检测的算法。本文主要工作及贡献如下:(1)采用RPN网络提取候选区域,分析了RPN网络中对预测的包围框进行回归的损失函数,使用改进后的交并比IIoU作为RPN网络对包围框回归的损失函数,以弥补原Smooth L1损失函数不能准确反映预测的包围框与人工标注的Ground Truth重叠情况的缺点。(2)将ROI池化层的每个单元格平均分为四个小区域,将每个区域的中心点作为采样点,采用双线性插值算法计算出四个采样点的像素值,再对这四个采样点执行最大池化操作得到该单元格的输出值。从而解决常规ROI池化过程中的取整操作造成的特征图上候选区域与原图区域不匹配问题造成的定位偏移,改进后的ROI池化操作对小目标定位效果有较大提升。(3)分析了不同深度卷积网络提取的特征图,发现浅层的特征图包含较多的轮廓、纹理等信息,有利于小目标定位,而深层特征图有高层的语义信息,有利于分类,于是提出基于VGG-16网络的多层卷积特征融合算法,使得融合后的特征图包含更多的信息来提高小目标的检测精度。(4)非极大值抑制算法直接将相邻区域同类别的候选区域的打分设为零,容易漏检重叠的目标,因此改进非极大值抑制算法,减少漏检情况。(5)将本文提出的针对小目标检测的算法整合为一个完整的算法,并在TT100K数据集上进行测试。测试结果表明,本文提出的算法在(0,32]分辨率范围内的准确率和召回率高于Faster R-CNN,以及Zhu et al.和Yan et al.等人的算法,同时在(0,400]和(32,96]分辨率范围的准确率也高于上述三种算法,综上,本文算法对(0,32]分辨率范围的小目标检测效果较好。