论文部分内容阅读
随着视频数据的日益丰富,在大量视频素材中方便地寻找感兴趣的视频片断的需求已变得日益迫切。于是,基于内容的视频检索已成为视频数据信息管理系统的一项关键技术,而视频镜头边界检测则是其研究重点。本文重点开展镜头边界检测方法的研究。
首先,介绍了基于内容的视频检索系统的背景及研究现状。并且,简介了一般的基于内容的视频检索工作过程,说明了研究镜头边界检测方法的重要性。其次,介绍了镜头边界检测的一般方法,分析其优缺点。然后,针对边界检测中常遇到的闪光检测和阈值选择问题,探讨可以采取的策略。同时,还较为详细地介绍了通常选用的视频特征及颜色空间,为本文提出的算法提供了理论依据。
接下来,通过对传统镜头边界检测方法和常用颜色特征的分析,提出了一种基于多特征的镜头边界检测算法。该算法将基于灰度特征的帧差法和基于H分量特征的直方图法两种传统特征算法的优点相结合,利用高斯分布得出的全局阈值检测出初步镜头结果集,并进一步归一化帧差,最后通过设计的基于权重的阈值进行二次检测,得出最终镜头集合。实验证明,对于突变镜头,它可以快速准确定位,但对于镜头剧烈运动仍存在一定程度的误检。
最后,为了进一步提高算法的精度,抑制对镜头剧烈运动的敏感度,结合了自适应的阈值选择方法,提出一种改进的基于多特征的镜头边界检测算法。实验证明,该算法保持原有的优势,并且进一步克服了对于镜头内部剧烈运动的误检。