论文部分内容阅读
视频群体行为识别是计算机视觉中一个具有挑战性的任务。由于场景变换、复杂的人群分布、透视效应等问题给人群密度分析、人群检测以及群体行为分析带来了诸多的研究难点,卷积神经网络为上述难点提供了可靠的解决方案。本学位论文以群体密度分析与视频中的群体行为识别为目标,首先设计一种基于深度分离空洞卷积神经网络的人群密度估计方法,然后设计一种基于密度图回归引导分类的人群检测与定位方法,最后设计一种基于密度等级划分的人群行为分析方法完成人群密度分析与视频群体行为检测。本学位论文的创新工作如下:(1)提出一种深度分离空洞卷积神经网络模型,用于在人群高度密集场景下的人群密度分析与人群计数。深度分离空洞卷积可以更有效的提取图像多尺度的特征,并利用空洞卷积神经网络在不增加参数的情况下扩大感受野,并加入分离层以及呈锯齿状的空洞率克服空洞卷积的网格效应,提高模型的计算效率,生成高质量的人群密度图。在Shanghai Tech_A/B数据集,UCF-CC-50数据集上对该模型进行评估,实验结果表明该模型预测误差较小,预测得到的人群密度概率图质量高并且与真实的密度图像分布相似。(2)基于深度图像使用深度自适应高斯函数生成人群密度图,利用深度图像覆盖人群密度图输入Retina Mask目标检测网络,使用目标检测网络中不同的解码层检测不同尺寸的头部,并通过人体头部的深度信息预估头部尺寸大小,初始化锚点信息,估计头部检测边界框大小,进行人体头部检测与定位,提高了目标检测网络的分类速率,有效的解决了人群密集场景下小尺寸头部的漏检问题。在MICC数据集和Shanghai RGBD数据集上对该方法进行验证,实验结果表明该方法可以检测到较小尺寸头部,有效提高检测的准确率与检测速率。(3)对于视频人群密度等级进行划分,在人群密集度较低的场景下基于视频获取时间信息和空间信息构建时空关联模型进行群体行为语义抽取,在人群密集度较高的场景中基于人群密度图结合卷积神经网络模型对人群的异常聚集和分散行为进行检测与预警,检测异常聚集的人群人数、地点,检测异常分散人群的人数、地点和分散速度。在Volleyball数据集上验证了稀疏群体行为检测的有效性,在PETS 2009数据集上对人群异常运动行为进行检测,实验结果表明该方法检测精度高并能准确定位异常发生的位置。