论文部分内容阅读
目标检测(Object Detection)是计算机视觉领域的一个研究热点,在智能视频监控,无人驾驶技术,计算机辅助诊断技术等方面都有着重要的应用。然而由于实际场景中目标物体的形变、遮挡、以及观察角度和环境变化等众多因素的影响,目标检测仍是一个具有挑战的任务。而如何设计能够准确识别目标物体又不受各种外界多样性因素影响的特征也成为了该领域的研究重点。传统的目标检测算法往往使用人工设计的特征算子进行特征取,但是这些取的特征属于比较浅层的信息,在检测性能表现上欠佳,而且设计这些特征常常需要丰富的背景知识以及专业基础知识,使得设计一个优秀的特征成本极高。而深度学习的出现和发展,很好地解决了这个问题。深度学习算法可以自动地从大量样本中进行学习,并针对不同的任务对取到的特征进行加工组合,从而学习到具有多层抽象结构的特征。本文在对深度学习和目标检测相关技术进行充分调研的基础上,分析了现有基于深度学习的目标检测算法存在的问题并做出了改进,本文的研究内容主要包括以下几个方面:(1)本文对现有的基于深度学习的目标检测算法进行研究与分析,指出了现有大部分算法在对位置预测与类别预测这两个任务使用相同特征图进行预测的特点。分析并指出了目标检测问题中位置预测与类别预测两个任务对特征特性的要求有所不同的特点。针对这个矛盾,在目标检测算法SSD300(Single Shot MultiBox Detector)基础上,对其网络结构进行了改进,出了DF-SSD(Decoupled Fused Feature Based Single Shot Multi Box Detector)算法,该算法在一定程度上分离了位置预测与类别预测使用的特征。考虑到位置预测需要更多的细节与定位信息,DFSSD还将位置预测所使用的特征图融合了通过膨胀卷积进行下采样的来自低层次的特征图。(2)由于SSD算法中所使用的特征均为比较深层的语义特征,而小目标的检测需要更多浅层的位移敏感特征,因此SSD对于尺度较小目标的识别准确率较低。因此需要对通过数据增强的方法来增加数据集中小目标样本数量。而SSD300所使用的方法引入了噪声,并且浪费了大量的存储空间。针对这个问题,本文基于金字塔图像序列出了一种增加小目标样本数量的方法,在不引入噪声的前下有效地增加小目标样本的数量。该方法首先将原始图像进行两种不同比率的下采样,形成图像金字塔序列,再将两层的金字塔图像进行拼接,以保证和原始图像大小相同。(3)基于上述研究,本文实现了一个简易的目标检测系统,从而可以直观感受检测效果以及定量的测量检测的性能。基于此系统设计了多个对照实验。实验结果显示,本文出的分离特征、特征融合、以及金字塔图像序列数据增强方法都不同程度地了高模型性能。DF-SSD在Pascal VOC 2007测试集上达到了78.7%的平均检测精度,在SSD300的基础上有了1.5%的高。