论文部分内容阅读
人物检测是目标检测的一个分支。它是人物识别和人物定位的一个综合,通俗来讲,它是指在图像中定位人物并找到人物的位置和范围,并用合适的框把人物标记出来。在当前各行各业智能化发展的今天,人物检测在很多领域有着广泛的研究和应用,作为必要的前置处理,它在智能交通,视频监控,目标跟踪等领域都很重要,因此人物检测算法在推进智能化建设的今天就显得至关重要。本文首先对目标检测和人物检测目前的发展情况和研究成果进行了分析总结,重点解析了深度学习领域的一些成果,比如R-CNN,Fast R-CNN,Faster R-CNN以及Yolo系列算法。在这个基础之上,我们也致力于解决人物检测问题中目前的研究难点,网络中特征提取不完全导致的准确率偏低,候选框的优化等问题,在前面研究的基础上我们做的主要工作有:(1)在人物检测过程中,关键环节之一是预选框的选择,预选框的选择将直接影响到人物检测效果的好坏,在本文中,我们分析了前面的预选框的选择历程,再结合我们的具体问题,考虑到人物大小特征的不确定性,在候选框的选择阶段,我们使用K-means聚类算法对数据进行聚类,通过可视化分析和IOU值的定量分析,综合考虑聚类复杂度和聚类结果,选择能更好拟合人物数据的候选框做为我们的预选框大小,对候选框的选择进行了优化,使得平均IOU值从原来的72.26%提高到90.97%,增强了网络的整体检测性能。(对应论文第三章第一节)(2)在本文中,我们通过对已有的检测网络进行分析之后,认为端到端的网络结构,即Yolo系列的网络,在速度和检测性质中能有更优越的性能,我们通过结合端到端网络的特征,对目前最流行的人物检测算法Yolov3做出改进来搭建我们的网络框架,第一阶段沿用在分类特征中已经被证明有着杰出表现的Darknet-53作为特征提取网络,在后面对多尺度图像特征进行综合,得到可以更好表达图片特征的特征图以进行人物检测。提出了一种新的人物检测网络模型PDnet,在定量评价标准中准确率从86%提高到92%,视觉表现中也表现出了更好的效果。(对应论文第三章第二节)(3)在前面我们研究的基础之上,我们考虑到图片采集和传输过程中无法避免的污染使得图片质量受损,我们通过研究解决这部分数据中的人物检测,首先我们使用去噪+检测的方法来解决该问题,对目前已有的去噪算法进行综合分析比对选出表现优异的去噪网络,在我们检测前期对图片进行质量评估,对达不到质量标准的图片首先进行去噪处理然后进行检测,该方法对污染图片的检测评价指标比之前提高了1.42个百分点,但检测过程繁杂。然后,为了简化检测过程,我们使用增加训练图片进行延扩训练的方法来增强我们前面提出的PDnet,发现检测结果的mAP值从66.73%提高到71.65%,并且检测过程简单,作为我们的第一种融合算法,再进一步,我们结合污染图片的特征属性和去噪网络中的好的结构,将去噪网络与我们的检测网络进行融合提出ResPDnet网络结构,对新的网络进行数据混合训练,得到的模型框架使该类图片的检测效果更进一步提升到73.11%。至此,我们的人物检测算法适用范围得到了扩展,并且,对于同类问题,也探索出一条可行的解决方向。(对应论文第四章)。