论文部分内容阅读
视频包含了最丰富的信息而与此同时也意味着它需要巨大的存储容量和存在着复杂的语义内容。用传统的手工索引和顺序查找方法在大量的视频数据中查找所需的视频片断是一项繁琐且耗时的工作,很难满足视频数据库的性能需求。而用户所需要的是通过内容进行查找,即通过一些给定的样例或特征描述便可得到所期望的视频片断。由于视频数据的复杂结构和时间上的多变性使得通过内容对视频进行索引成为大家关注的热点和难点问题。研究人员已经提出了各种各样的方法与技术试图解决这个难题。基于内容的视频索引中的主要步骤有视频分割、关键帧的选择、静态特征与动态特征的提取以及视频聚类等。论文中,我们在视频分割、关键帧选择方面做了以下主要工作: 1、讨论了视频镜头边缘检测问题并对镜头分割中的常用算法进行了分析。 2、我们在分析、对比原有视频字幕提取算法的基础上提出了一种基于支撑矢量机的小波域视频字幕检测与提取算法。它利用小波变换域中的统计特征和支撑矢量机分类器,使得算法有较强的鲁棒性和普适性。 3、视频的关键帧表示适合于在有限的存储空间或传输带宽条件下对视频进行检索与浏览,因此生成与具体条件相适应的关键帧就显得至关重要。为此,本文提出了一种条件约束的关键帧选取算法,它可以根据具体的要求动态调整所生成关键帧的帧数。 4、通过分析视频关键帧构建了一个适合关键帧表示的数学模型,在这个模型的基础上我们提出了一种基于多克隆选择的视频关键帧选取算法,该算法把选取关键帧的问题转化为一个优化的问题并用多克隆选择算法求解,仿真实验表明本文的算法是可行的且有效的。