论文部分内容阅读
随着互联网技术和多媒体数字技术的快速发展,数字视频的应用越来越广泛。各种功能强大的视频篡改软件,使得数字视频的完整性和真实性面临极大挑战,视频取证技术应运而生。数字视频的被动篡改取证技术成为检验视频完整性和真实性的重要手段。传统的数字视频取证算法不仅需要专业人员来提取篡改特征,还需要通过复杂的计算以及恰当的阈值来判断视频是否被篡改,因此,其准确率低且计算复杂。近年来,深度学习的方法在图像识别领域中取得了巨大突破,为数字视频取证技术提供了一种新思路。本文在分析视频篡改和视频压缩编码的基础上,提出了两种基于深度学习的视频篡改检测算法。实验表明,基于深度学习的视频篡改检测算法操作简单、准确率高、速度较快。本文的主要工作如下:(1)本文提出一种基于回归算法的视频篡改标注方法。该方法通过人工间隔标注方法来标注一部分视频帧从而获得视频标注数据,选取与标注数据的分布特点相匹配的回归器模型,利用标注数据来对模型的结构参数进行调整,最终得到一个误差损失函数最小的训练好的回归器模型,用该回归模型预测其余未标记的视频帧数据,从而得到该视频所有的标注数据。该方法大大降低人工标注的成本,同时加快了标注的效率,适用于较大规模数据标注任务。(2)本文研究了两种基于深度学习的视频篡改检测算法。一种是基于残差网络的视频篡改检测算法,该算法利用残差网络增加网络卷积层数,提高了网络特征提取及非线性拟合的能力,从而使得检测准确度得到提升。实验结果表明相对于传统算法,该网络的识别准确率有显著提高。然而,该算法存在计算量大、运行效率低以及提取特征不全面的缺点。针对上述缺点,我们提出了第二种算法——基于Google Net的两级分类的视频篡改检测算法。该算法利用第一级分类器提取视频帧的残差图像,接着使用高通滤波器和共谋运算来增强残差图像中因篡改操作而引入的伪影信息,最后利用阈值分类器对视频序列进行分类,得到篡改视频和原始视频。第二级分类器则利用Google Net的Inception-V3网络来定位篡改视频帧。具体地说,该网络通过多样化的卷积核提取视频帧深层特征来检测视频帧是否经过篡改,以此定位篡改视频帧在视频序列中的位置。该方法在取得较高识别准确率的同时,具有较强的篡改视频帧定位能力,且操作简单,时间代价低,具有一定的实用性。