论文部分内容阅读
随着近几年计算机科学技术的飞速发展,特别是深度学习技术在计算机视觉领域取得的突破性成果,使得基于计算机视觉技术的智能监控系统开始慢慢应用于我们现实生活中的方方面面。对监控区域进行实时、准确的人数统计是智能监控系统的一个重要应用方向。所以对视频监控场景中人数统计方法的研究不仅具有重要的现实意义,同时还有广泛的应用前景。本文采用人体目标检测的方法对监控场景中的人体目标进行统计,使用区域全卷积神经网络作为本文研究的基本网络模型。通过对视频监控场景中监控画面的分析,本文设计了一种应用于视频监控场景中的人体目标检测方法,旨在对视频监控场景中的人体目标进行统计。该方法的具体内容主要包括以下三个方面。1、本文采用人体头肩Omega模型作为视频监控场景中人体目标的表征模型。较于人们普遍采用的人体全身模型,人体头肩Omega模型具有更高的稳定性,同时该表征模型可以大大减少人体目标被遮挡的情景。2、对于复杂场景中一些人体目标存在漏检的问题,本文将难例挖掘算法应用于区域全卷积神经网络模型中,通过改进网络模型的更新策略,不仅提高了网络模型对复杂场景中人体目标的检测能力,同时也减少了区域全卷积网络模型训练时的超参。3、针对视频监控场景中人体目标存在多尺度检测的问题,本文从网络模型生成候选检测窗口的角度出发,对多个数据集中人体标定框的尺度和高宽比分布进行分析。本文改进生成候选检测窗口的区域候选网络,通过更新区域候选网络模型中Anchors的生成规则,提高区域候选网络对不同尺度人体目标的定位精度。本文使用该方法与另外两种人体目标检测方法分别在三个数据集上进行对比实验,证明了本文的方法在视频监控场景中具有较好的检测效果。同时,本文使用该方法在监控场景中进行人数统计的对比实验,证明了本文的方法在监控场景中具有更高的统计精度。最后,本文将该方法应用于实际的智能视频监控系统中,取得了令人满意的应用效果。