论文部分内容阅读
在计算机视觉领域,智能的对视频中群体异常行为进行检测成为广泛关注的热点问题。这一方向在智能交通、安防监控、人机交互等方面有着理论与应用双重价值。本文研究的是基于时空特征点对视频中群体异常行为进行检测,分析视频中的逃跑、打架等异常行为。
针对基于跟踪或粒子流的全局方法计算量大、受光照、遮挡等干扰严重的缺点,本文根据人类群体运动的视频中存在时间和空间方向上剧烈位置变化的特点,同时时空特征点(STIPs:Spatial-Temporal Interesting Points)方法在简单人体行为识别中取得了成功,提出了用时空特征点来描述人类群体的运动的新方法,即从视频中提取时空特征点,对人类群体行为进行局部描述。通过比较分析三种不同的时空特征点提取方法的优缺点,我们选择了一种基于Hessian矩阵的的尺度不变特征点提取方法。
在时空特征点产生以后,我们对时空特征点构建了描述符。为了测试算法在不同描述符下的性能,采用了梯度方向直方图、光流方向直方图、时空Haar特征三种描述符并对构建方法进行了详细阐述。
在对正常行为建模及检测阶段,使用了Bag-of-words模型。产生关键词(words)时,为了克服传统的K-means方法无法准确描述数据集分布的特点,使用了基于EM估计的高斯混合模型建模方法,使产生的关键词有效描述一组数据的概率分布。然后对样本中部分正常行为视频进行划分,根据关键词为每一视频片段建立一个带有概率分布的编码向量,所有训练样本的编码向量组成编码表。在检测阶段,也需要对测试视频进行划分,提取时空特征点后与关键词进行匹配,根据每一视频片段的关键词分布构成测试样本编码向量,然后计算它与训练样本编码表中各项的欧氏距离,当最小距离大于一定阈值时,则认为测试视频片段所含行为为异常行为。
本文对提出的算法进行了大量的实验,在两种不同数据集下,在取不同的描述符、不同的模型数量时,给出测试的ROC(Receiver Operating CharacteristicCurve)曲线并对特定阈值下检测结果与真值进行了对比。在UMN数据集下,时空Haar特征获得较好的效果,而在UCF数据集下,光流方向直方图则优于其它两种描述符。实验验证了算法具有较好的性能,说明算法能有效的检测异常行为。