论文部分内容阅读
目标检测是计算机视觉中一个具有检测难度的任务,贴近现实生活中应用的需求,在人机交互、机器人视觉、汽车辅助驾驶等诸多应用领域均起着举足轻重的作用。近年来,计算机视觉在深度学习方面的研究得到显著的进展并实际应用到某些生活领域中,然而目标检测作为其一个分支已得到广泛的研究,然而因为图像中目标尺度多变而面临巨大的研究挑战。在实际应用的现实场景中,目标的尺度范围变化大,小、中、大尺度的目标均有不同数量的分布,然而现行的目标检测方法大多没有考虑尺度范围对于检测精度的影响,导致这些目标检测方法往往仅适应于某些尺度范围的目标检测场景。本文针对目标检测问题进行了细致的研究,设计了一系列检测方法用于改善小尺度目标的检测、中、大尺度目标的检测,最终设计了一种用于多尺度目标检测的方法。本文的研究思路如下:首先,在挖掘遮挡样本的启发下,设计了一种可自动生成遮挡样本的遮挡网络,以提高中、大尺度目标的检测效果。接下来,对小尺度目标难于检测的原因进行了理论分析,认为较大的感受野会忽略掉小目标原本不多的特征信息量。因此做出假设,小尺度目标的检测不会得益于更大的感受野,由此进行实验分析感受野对于小尺度目标检测的影响,并寻找在固定滤波器尺度下,合适的卷积层数。最后,根据上述研究,设计了一种基于遮挡网络和RPN的双通道多尺度目标检测网络结构,统计Pascal VOC数据集中目标尺度大小与纵横比,设置了该网络的锚点规格,此外针对该网络结构在实际应用时遇见的检测问题,本文还提出一种重复检测候选框的提出策略。本文的研究目标在于发现影响小、中、大尺度检测效果的主要因素,依此改进现行先进的检测器提高不同尺度目标的检测效果,综合建立一种适用于多尺度目标检测的深度方法。本文为验证所分析因素与设计方法的合理性与有效性,本文在COCO数据集上进行了大量的消融实验与对比实验。消融实验结果显示,遮挡网络的设计极大改善了中尺度目标的检测,改善了大尺度目标检测。同时,消融实验还显示框架小通道设计确实有利于小目标的检测。对比实验结果显示,本文所提出的双通道多尺度目标检测方法与同期先进目标检测方法在尺度方面具有较强的竞争力,在小、中、大尺度目标的检测上表现优异。同时,本文的研究理论具有通用性,可具体应用到其他的目标检测领域,比如:多尺度行人检测、多尺度车辆检测等。