论文部分内容阅读
随着“平安城市”、“平安校园”等项目的推进,智能化视频监控已经成为公共安全领域的一项重要技术,而异常事件检测则是提高视频监控智能化程度的一个主要途径。异常事件检测是指利用机器学习和计算机视觉技术,在没有人工干预的情况下,对视频序列进行自动分析的视频监控技术。当视频中出现可疑目标时,系统能实现自动地检测和分析,并将结果反馈为监控人员。这一技术的发展有效地解决了视频监控技术对人力资源的严重依赖,并显著降低了对存储空间的需求。异常事件检测是计算机视觉领域一个重要且富有挑战性的研究课题,该课题的研究具有重要的学术价值和应用前景,对国防安全、公共安全,和家庭看护都具有非常重要的意义。近年来,随着视频分析技术和模式识别技术的进步,异常事件检测技术取得了长足的发展,但仍然存在以下问题:1)对视频事件结构关系的研究不够充分;2)忽略了对异常视频事件组成的研究;3)视频事件的特征表达不够完善。针对上述问题,本文从三个方面开展了对异常事件检测方法的研究,主要研究内容和创新点总结如下:1)基于结构字典学习的异常事件检测。目前的工作大多将视频事件看作独立的个体,忽略了视频事件的结构特性。为此,本文提出参考视频事件的概念,用来描述正常视频事件中的典型事件类型。并提出一种结构平滑正则项,将原始视频序列和视频特征空间中的结构关系传递到稀疏表达的系数空间中。在Avenue数据集上的实验表明,相比于不考虑视频事件结构关系的字典学习,该方法在目标层的平均检测精度上提高了3.9%。2)基于假设检验的异常事件检测。传统的方法只考虑正常视频事件的组成方法,而忽略了异常事件的信息,将异常判定为与正常事件不一样的视频事件。本文提出对异常视频事件进行建模的方法,将异常事件判定为包含异常事件模式,同时表达精度明显优于只考虑正常事件模式的情况。另外,传统的方法认为视频事件表达过程中的噪声采样自单一的高斯分布。然而,实际中的噪声却是多种分布的组合。为此,本文利用混合高斯模型对噪声分布进行建模,因为它可以逼近任意连续的概率分布,这样更符合实际情况。同时,本文利用异常检测结果挖掘测试视频中与训练数据集不一致的正常视频事件,并用于事件模型的时间补偿。在三个数据集上验证了该算法的优势,以及算法中每个因素的有效性。3)基于深度表达的异常事件检测。截至目前为止,大部分异常事件检测方法采用的都是手工设计的特征。尽管这些方法取得了较高的检测精度,然而,手工特征的设计不仅费时费力、设计困难,而且很难确定某一场景应该采用哪种特征。为此,本文提出一种基于深度表达的异常事件检测算法,从表观、纹理、短时运动三种线索中有效地提取和融合视频事件特征。由于视频事件的时间连续特性,本文构建了一种基于长短时记忆网络的预测模型,提取视频事件长时间的依赖关系。基于视频事件的空间分布,设计了一种自适应权重的流形排序算法,在保持时间异常检测结果的同时,考虑视频事件间的相互关联,既降低了误警率,又提高了异常视频事件的判别性。实验结果证明了深度学习特征在视频事件表达和循环神经网络模型在长时间视频事件建模上的可行性。