论文部分内容阅读
随着互联网的迅速发展,视频数据作为人们获取信息的主要方式之一,在互联网中占据的比例逐渐增加,视频数据的形式多种多样,例如电影、电视剧、短视频等。视频信息中包含了丰富的的人物、事件、场景等相关信息,如何利用这些信息进行特定的内容挖掘从而为实际生产生活提供遍历成为人们研究的热点之一。近年来,深度学习在目标检测与追踪、人脸识别、动作识别等任务中展现了显著的优势与潜力,有望胜任更为复杂的任务;同时,Spark并行计算框架在分类、聚类等任务中效果显著。利用深度学习模型,与Spark并行计算框架相结合,进行更为准确有效的相关信息挖掘,逐渐成为新的关注热点。同时,人工智能合成的人脸交换视频已成为一个新兴问题。虚假视频越来越难以识别,给社会保障带来了一系列挑战。视频篡改技术的不断进步和视频质量的不断提高,也给假检测带来了巨大的挑战。基于上述背景,本课题主要做了如下研究工作:(1)提出了一种基于聚类的嵌入正则化方法来检测深度假视频。构建的深度假视频检测模型以Xception为基础网络,从网络结构、参数配置、数据集特性和所研究问题对基础网络进行优化。其中最重要的优化部分是,增加对生成假视频过程的模拟,它通过对生成假视频过程中分辨率缩放产生的伪影的检测来提高深度假视频检测精度。(2)设计实现了深度假视频的并行检测算法。随着多媒体技术的发展,海量视频不断涌现,每天产生的数据量已达到PB级别,如果快速的处理这些视频数据成为大数据领域的研究热点。本文针对提出的深度假视频的检测算法,设计实现基于分布式深度学习框架的并行检测算法。(3)设计实现了一个基于分布式深度学习框架的视频大数据分析原型系统。该分析系统允许使用者使用常用的视频处理算法及本文提出的深度假视频的检测算法去解决实际问题。