论文部分内容阅读
随着互联网以及多媒体技术的飞速发展,使得数字视频在人们的日常生活中越来越普及。人们可以方便的使用手机等便携设备拍摄数字视频,在线视频播放网站如雨后春笋般涌现,大型视频数据库也愈发常见。如何高效的存储和管理大量的视频内容信息成为亟待解决的问题。并且,伴随着视频内容的丰富化和视频种类的多样化,人们迫切需要一种快速有效的了解视频内容信息的方式。然而要实现对视频数据的理解和分析,就需要完成大量的视频数据处理,这在实际应用中不是一项容易的工作。抽取视频序列中的关键帧序列能够很好的解决上述要求,即通过一组具有代表性的视频帧序列——视频关键帧,来表示原始视频序列的主要内容信息。本文首先对视频关键帧抽取的相关知识做了概要介绍。在这个基础上,本文提出了一种新的视频关键帧抽取方法。本方法首先计算视频相邻帧之间的相对熵(Relative Entropy,简称RE)或相对熵的平方根(Square Root of Relative Entropy,简称SRRE)来表示视频相邻帧之间的差异值,然后通过统计学中的离群值检测算法——极值学生化离差(Extreme Studentized Deviate,简称ESD)检测法寻找离群值,再通过多项式回归的方式进行修正,寻找最优分割阈值定位镜头边界,实现视频序列的自适应镜头分割。为了进一步分析视频每个镜头的内容信息,在此基础上本文根据镜头内容变化的剧烈程度将镜头进行细分为不同类型的子镜头,并在每个子镜头内部抽取关键帧。另外,本文还提出一种采用层次策略的视频关键帧的多尺度摘要方案。通过大量视频数据的实验测试,将本文中提出的方法的关键帧结果与其它方法的关键帧结果进行对比,本文方法无论是在客观评价还是在主观评价方面都优于对比的方法,而且本文方法基本达到了普适性和实时性的效果。