论文部分内容阅读
目前监控摄像头在我们的生活中得到了广泛的应用,随之产生的一项挑战便是如何自动地在监控视频中检测感兴趣的事件。一方面,我们希望从过往的海量监控视频中快速地找到发生特定事件的视频片段;另一方面,我们希望计算机对于监控场景中出现的异常事件及时地进行报警。针对这两方面的要求,本文主要研究如何通过机器学习的方法进行监控视频事件检测,以实现对感兴趣事件的快速定位和自动识别。本文的主要创新点包括: 第一,针对单对象行为事件,本文提出了一种基于密集轨迹的轨迹包算法,能够有效地在时空域获得对象动作序列的关联信息。轨迹是一种描述了局部运动信息的时序信号。轨迹包算法利用非监督动态时间对齐的 K-中心点算法从轨迹集中总结出典型的动作模式,进一步对视频轨迹进行量化统计获得视频的高信息量的描述子,然后利用支持向量机进行事件分类。通过在多种数据集上的对比试验证明,该方法能够得到对象动作的高信息量的描述,在单对象行为识别中得到了较好的结果。 第二,针对多对象交互事件,本文提出了一种基于时空立方体特征和序列判别式学习的检测方法,用于解决交互事件中对象交互信息的描述和动作序列模式的识别问题。该方法首先将视频片段划分成若干时空立方体,然后在每个时空立方体内提取多种描述子(统计轨迹描述子,时空兴趣点词袋描述子),之后利用多核学习方法将提取的描述子融合成一个时空立方体特征,最后应用基于时间对齐核函数的序列判别式学习方法检测视频中感兴趣的事件。通过在TRECVid数据集上的实验表明,本文所提出的时空立方体特征在描述交互事件视频上,具有较高的区分性和健壮性;本文所提出的序列判别式学习方法能够有效识别事件的序列模式,相比于一般学习方法,该方法在交互事件检测中表现出了更好的性能。 综上所述,本文针对监控视频中单对象行为事件和多对象交互事件的检测问题进行了研究。对于视频中对象的动态信息描述方法和事件序列模式识别方法两个方面都进行了探索。通过大量实验展示了本文所提出的监控视频事件检测方法的可行性和有效性。