论文部分内容阅读
随着计算机网络的普及和人工智能的快速发展,人们对人工智能提出的要求也越来越高。人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,本文面向的视频混剪任务即是如此,人类剪辑师需要积累大量的视频素材制成素材库,再从素材库中选出合适的视频素材,一般剪辑一个3分钟的视频需要选择超过120个视频素材,如此耗费人力物力的工作完全使用人工智能替代。基于此,本文独创提出一种能够从自然语言处理角度完成基于主题句的视频自动混剪任务的模型框架,并设计实验验证其有效性。本文设计了一种视频自动混剪模型,该模型能够代替人类完成按照主题句混剪视频的任务。本文还提出了一种主题过滤模型,该模型是视频自动混剪模型的核心部分,负责视频片段的语义筛选。此外,本文还提出了一种混合多种特征的语义句子匹配模型(MFF),该模型中的特征交互层包含五种特征的融合交互过程。最后,本文还针对盲人电影自动生成任务设计了一种实现框架模型,该模型中包括一个独创的顺序对应算法用以提高对应准确率。对于上述提出的几个模型,本文分别设计实验验证其有效性。其中,多特征交互语义句子匹配模型在自然语言推理标准数据集“SNLI”和句子改写标准数据集“Quora Question Pairs”上的测试准确率远高于标准模型,展现了模型对于语义特征提取的优越性。主题过滤模型实验采用对比的方式,比较了基于MFF的主题过滤模型与基于siamese结构的语义句子匹配模型的主题过滤模型之间的BLEU评估值,结果显示本文提出的基于MFF的主题过滤模型具有极佳的效果。实验还展示了按照给定主题句自动混剪出的视频片段,结果显示本文提出的视频自动混剪模型的有效性。盲人电影部分,本文针对剧本和电影字幕预处理设计实验探索提高匹配准确率的方法,实验探索出有效的预处理方法,且本文提出的顺序对应算法也提高了准确率,最终生成的盲人电影证明了该模型的有效。