论文部分内容阅读
智能视频监控作为公共安全管理的一个有效手段,越来越受到各方的重视。随着国内各地平安城市、天网工程等一大批的安防摄像机的建设,大范围覆盖、多摄像机协同场景下的视觉群体目标的分析技术,成了智能视频监控的一个重要研究方向。群体目标分析的内容包括目标的轨迹、密度、数量和流量等,在真实视频监控应用中,常常因为诸如复杂的现场环境、恶劣的天气、变化的光照、各种噪声的干扰等因素,难以推广使用。而在多摄像机协同分析大范围场景下的群体目标时,不但对算法的场景适应性要求更高,协同分析目标轨迹、密度和流量等,也变得更加困难。本文以实际应用为背景,以群体目标在多摄像机场景下的轨迹跟踪和密度、流量分析为切入点,深入研究群体目标在真实大范围场景下的分析方法,形成完整的大范围监控场景下的群体目标分析方法流程,以及相关的应用系统。论文的主要工作和贡献如下: 1.提出了一种基于均衡全局图模型的多摄像机目标轨迹跟踪方法,克服了传统两步式多摄像机目标跟踪方法的缺陷(要求首先获得单摄像机目标轨迹或者目标检测结果),使得其实用性大大提高。该方法通过提取目标的稳定轨迹片段,使用全局图模型把单摄像机轨迹跟踪和跨摄像机轨迹关联融合在一个框架下进行优化,并且对不同摄像机下的目标表观和运动特征的相似度进行均衡化处理,最终明显提升了跨摄像机轨迹关联的准确性。通过对单摄像机和跨摄像机下轨迹跟踪结果的综合评价,表明该方法在大范围轨迹分析时,特别是单摄像机目标跟踪性能有限时,有较好的性能。 2.提出了一种场景通用性较好的群体密度估计方法,解决了传统方法场景适应性差、参数调节复杂的问题,并且实现了在大范围场景下,通过多个摄像机对局部人群密度的分析和关键点位人群密度的预测。该方法使用马赛克图像累积差分特征提取群体聚集区域,并对其进行透视变换矫正用以估计人群密度。通过对人群数量和运动速度的估计,可以实现预测指定点位的人群密度。经过与现有的方法对比,以及在真实场景中的应用后发现,该方法无论在不同的场景中,还是在不同的人群密度下,不需要调节过多参数即可保持较为有效和稳定的效果。 3.提出了一种基于深度神经网络模型的群体目标流量分析方法,并创建了十万级的相关数据库用于训练,相比于传统方法,提升了对新场景的适应性和密集人群流量统计的稳定性。该方法借鉴了图像序列采样的思想,提取了视频的原始采样图和光流特征采样图,并使用多个深度神经网络模型对采样图进行特征提取,以此来估计群体流量。创建的群体目标流量估计数据库,不但包含实际场景中的不同角度和不同规模的群体流量,并且涵盖了不同的天气情况和时间段。实验表明,传统的方法只能在特定的场景,流量较少时发挥作用,而本文提出的方法可以较好的估计嘈杂室外环境中的大规模群体目标流量。