论文部分内容阅读
随着公共安全问题的日益突出,及时地发现公共场所发生的异常事件,将有助于相关安全部门快速地采取措施并提供救援,从而减少居民的人身伤害及财产损失。近年来,随着智能监控和安全技术的飞速发展,基于视频的异常事件检测已成为图像处理、机器视觉、机器学习等领域的热门研究课题之一。异常事件检测的主要任务是自动筛选视频中的异常事件,继而反馈并处理这些被筛选出的异常事件。但在实践中,列举出在给定的监控视频序列中可能发生的所有异常情况是不可行的,这使得该研究课题更加具有挑战性。此外,复杂视频中的异常事件为智能监控、自动报警系统等各种前瞻性应用提供了大量有价值的信息,这使得这一问题更具现实意义。目前所有解决异常事件检测问题的前沿性方法大致分为两类,一类是基于浅层次人工特征提出的算法,另一类是基于深层次理解特征提出的算法。这两类方法多数采用分段学习的方式,而这种方式将带来不可避免的局部最优解问题。本文首先提出了一种将单类支持向量机(One-class SVM)集成到卷积神经网络(Convolutional Neural Networks)中的用于监控视频异常事件检测问题的全新解决方案,即端到端的深度单分类异常检测模型。不仅如此,文中还引出了一种从单类支持向量机中导出的鲁棒损失函数,以优化该模型的参数。与分段模型相比,该检测模型不仅简化了过程的复杂性,还求得了整个过程的全局最优解。实验结果表明,深度单分类检测模型具有较好的性能,对监控视频异常事件检测问题非常有效。此外,现有大部分研究算法并不能同时处理小规模数据和大规模高维数据,一些处理小规模数据的方法应用到高维数据中将显现出超高的计算复杂度,而一些能够处理高维数据的方法所提取出的中间数据将占用大量的存储空间。为解决这类问题,本文还提出了一种基于变分自编码器(Variational Auto-Encoder)隐藏空间字典的稀疏表示框架。对于大型数据集,它可以起到降维的作用,获取隐藏信息,并提取比浅层人工特征更有意义的特征。同时,对于正常事件信息的存储,空间成本大大降低。为了验证该算法的通用性和性能,实验部分对不同类型的异常检测任务进行了对比。除深度单分类算法用到的UCSD行人数据集,还使用了用于网络入侵检测的KDD-CUP数据集和用于图像异常检测的Mnist数据集。实验结果表明,该算法在各种异常检测任务中均具有较好的实验效果。