论文部分内容阅读
随着多媒体技术和网络技术的飞速发展,视频信息的采集变得愈加便捷。基于视频数据的各类应用已成为人们日常生活和工作中不可或缺的部分,由此引发了海量视频数据的存储与管理问题。如何快速有效地查找所需的视频信息具有非常紧迫的现实意义。正是在此情况下,视频资源的管理和检索技术成为了一个研究热点,而将视频信息进行结构化处理是基于内容的视频检索技术的基础。 本文综合介绍了常用的视频特征以及特征提取技术、支持向量机理论与分类器设计技术,着重研究了镜头边界检测与关键帧提取技术,并基于不同理论基础设计镜头边界检测与关键帧提取算法。 本文的主要贡献和完成的工作包括: 1)提出了一种基于交互信息量的镜头边界检测算法。该算法采用基于HSV空间不均匀分块直方图求取的帧间交互信息量作为视频帧间差异度量,结合相应的阈值策略与时域窗策略,对视频序列顺序处理一次即可完成对切变边界和渐变边界的检测。该算法能有效减弱摄像机运动与光照变化对镜头检测的影响,具有较高的查全率与查准率。 2)设计了一种基于支持向量机的镜头边界检测算法。该方法包含三个步骤:首先对视频片段进行预处理,剔除理论上不包含镜头边界的视频帧;其次训练分类器初步预测镜头边界的位置;最后对分类结果进行综合判定以确定最终的镜头边界。在分类器设计方面,选用颜色特征、运动特征等多类特征构成训练数据,并充分考虑了样本质量对分类器性能的影响。该方法能够在减低计算复杂度与提高检测准确率两方面达到综合最优的效果。 3)提出了一种依据运动特征阈值动态选择帧数的关键帧提取算法。该算法根据镜头内视频内容差异程度,自适应地选取关键帧数目的上限。该方法不仅可以在内容变化不大的镜头中快速提取关键帧减少不必要的计算复杂度,而且能够保证在视频内容变化较大的镜头中提取出充分数量的关键帧来准确表征镜头内容。