论文部分内容阅读
关键帧提取技术是视频分析和基于内容的视频检索的基础,用于描述一个镜头的主要内容。关键帧的使用大大减少了视频索引的数据量,同时也为视频摘要和检索提供了一个组织框架。正是由于关键帧的提取在基于内容的分析、检索以及查询中具有如此重要的地位,近年来受到了研究者的广泛关注,也取得了一定的研究成果。
对于关键帧的提取,如利用帧图像的全局信息进行关键帧提取时,由于其对场景的局部变化(如人物在同一场景中走动、物体移动等)不敏感,虽然提取的关键帧数目少,但常常并不能很好地描述镜头的内容。另一方面,仅利用帧图像的局部信息(如通过分块的方式)来进行关键帧提取时,提取的关键帧虽然可以很好地描述镜头的内容,但它提取出的关键帧数目确使人难以接受。
针对分块方法冗余度过大而全局直方图表达能力不足的问题,本文采用了先利用分块中心矩比较来获得一个具有较大冗余度和包含运动剧烈程度信息的候选关键帧序列,再通过全局直方图在候选关键帧序列中获得可能为目标物体或背景变化位置的端点帧序列,最后根据规则最终得到该镜头的关键帧,这样很好的将两者的优势互补。
通过仿真实验结果表明,该方法弥补了全局直方图和分块提取算法的缺点,通过对广告、电影等视频片段的实验发现其具有较强的鲁棒性,其提取的关键帧能较好的反映出镜头的内容。