论文部分内容阅读
近年来,公共场所中的群体安全问题也成为全球范围内关注并亟待解决的问题。传统的视频监控处理主要依赖于人力资源进行监控,耗费大量财力物力并且效率低下,已经不能满足目前智能视频处理的要求。目前基于计算机视觉技术分析视频内容的方法得到快速发展,一般从人群数量和人群行为两方面进行人群分析,对人群计数并检测人群异常行为,具有重要的学术价值和应用前景,也是当前计算机视觉领域研究的热点和难点之一。对人群场景中的人群计数并进行密度估计,可以获取场景中人群分布信息,防止因过度拥挤发生踩踏等安全事故;而对人群中的异常行为进行检测,及时发现人群中危险信号,能够避免突发性群体事件的发生。因此为了防止人群聚集的公共场所中安全事故的发生,对基于视频监控的群体密度和群体异常行为检测深入研究具有重要的应用前景和学术价值。本文在深入分析研究现有方法的基础上,构建了基于深度生成对抗网络框架对人群密度进行估计,同时提出了一种基于聚类簇约束的增量非负矩阵分解方法用于人群异常行为检测。(1)针对人群场景中尺度变化等问题,本文提出了一种深度生成对抗网络(Deep Generative Adversarial Network,DGAN)框架进行人群密度估计和人群计数,首先使用深度网络提取人群场景图片的多尺度抽象特征,并使用膨胀卷积和反卷积网络层对特征尺度进行归一化,在去除冗余信息的同时最大化保留网络多层的丰富表示。通过融合网络的多层特征获取人群场景的多尺度表示,以提高对人群尺度变化的鲁棒性。然后使用全卷积网络对特征图进一步学习,生成估计的人群密度图像。为了使估计的密度图与真实的高斯密度图的误差更小,本文在深度生成对抗网络中分别使用了欧式损失和感知损失,保证估计的人群密度图在像素级和特征级更真实,使得估计的人群密度更加准确。(2)考虑到人群异常行为检测中存在样本较少、数据分布不平衡等问题,本文将异常行为检测问题当作单分类问题处理,提出一种基于聚类簇约束的增量非负矩阵分解方法(Incremental Non-negative Matrix Factorization Based on Clustering Constraints,INMF_CC)用于人群异常行为检测。将正常事件作为正样本数据,异常事件作为负样本数据,通过在特征空间寻找一个最优正样本聚类簇球体,从而通过测试数据映射到特征空间的位置判断是否为异常事件。在构造特征空间的过程中,本文添加特征空间的约束惩罚项,保证正样本的聚类簇内部更紧凑,聚类簇外部与负样本之间更离散,从而实现对特征空间进行优化,最终将异常行为检测的准确率进一步大幅度提升。最终本文提出的人群密度估计和人群异常行为检测方法分别在多种数据集中进行人群计数和异常检测的实验,与目前流行的研究方法进行了对比分析,充分验证了本文方法的有效性。