论文部分内容阅读
随着社会信息化的发展,大量监控视频不断涌现,如何从海量的监控视频中实时准确地找到异常并进行预警是当前研究的热门话题。目前,以无监督的学习方式利用深度神经网络端到端地学习正常视频数据的特征,将不符合正常特征的视频标为异常的视频异常检测方法为研究主流。变分递归神经网络(Variational Recurrent Neural Network,VRNN)就是一种无监督的异常检测模型,它将变分自编码器(Variational Autoencoder,VAE)与长短时记忆网络(Long Short-Term Memory,LSTM)进行了组合,每个时间步长内都包含着一个VAE,而VAE的先验信息由先前的视频帧经LSTM所提供,因此该方法可直接对连续的视频帧进行建模,进而预测输入数据的未来帧,最终利用预测误差判别异常。但该模型训练时易产生KL散度消失问题,导致其无法学习到一个有意义的潜在变量。为解决以上问题,本文通过调整目标函数中重构项和KL项之间的权重分配,提出了两种基于帧预测的视频异常检测算法。论文的主要研究内容如下:(1)针对VRNN训练过程中存在KL散度消失,导致模型异常检测的准确性差的问题,引入了KL退火算法,提出了一种基于KL退火的VRNN——退火变分递归神经网络(Annealing Variational Recurrent Neural Network,Annealing-VRNN)。通过在KL项加入从0到1的可变权重(4)),使其随训练次数的增加逐渐退火成普通的VRNN。在数据集UCSD ped1和UCSD ped2上进行了实验,结果表明与普通的VRNN相比,改进后的Annealing-VRNN的AUC值分别为94%、96.56%,提高了视频异常预测的准确性。(2)Annealing-VRNN虽缓解了KL散度的消失,但随着训练次数的增加,仍然会陷入KL散度的消失。考虑到实际KL值的影响,引入了PID控制算法并对其进行了改进,提出了一种基于改进PID控制的VRNN——控制变分递归神经网络(Control Variational Recurrent Neural Network,Control-VRNN)。该模型将KL值控制在规定的范围之内,彻底解决了模型在训练过程中KL散度的消失。结果表明,改进的Control-VRNN比VRNN在ped1和ped2上的AUC值有明显提高,分别为96.4%、96.42%。(3)引入峰值信噪比替换L1损失、MSSSIM损失和GDL损失的加权和来评估预测帧和真实帧之间的差异,进而判别异常。实验结果表明,峰值信噪比能更好的评估预测帧的质量,提高模型的异常检测效果。本文针对VRNN模型在训练过程中产生KL散度消失的问题,引入了KL退火算法和PID控制算法,提出了两种视频异常预测算法,并经过实验证明了算法的合理性,具有一定的理论意义和应用价值。