论文部分内容阅读
随着网络、多媒体技术的不断发展,网络视频图像的应用越来越广泛,使得基于内容的视频检索技术成为当前图像理解研究领域的热点之一。镜头作为组成视频图像的基本单元,其边界的检测是进行视频分段、组织、索引的基础,是视频检索中高级语义获取、内容分析的关键,其检测质量将直接影响到基于内容视频检索的效率。然而,由于视频图像的多样性,视频中包含的内容以及内容之间转换的镜头边界的形式较多,从而给镜头边界检测带来很多困难。为了较好地解决不同转换形式镜头边界(如叠化、划变等)的检测,本文在总结分析现有的镜头边界检测算法的基础上,利用非相邻帧之间直方图差值,研究渐变镜头的检测方法,主要研究内容包括以下几个方面:分析了镜头转换过程中非相邻直方图差的变化规律,讨论了利用非相邻直方图差进行镜头检测的基本原理,根据镜头中含有突发强度变化(如闪光)所持续的时间特性,给出了有效的镜头突变检测方法,并得到镜头渐变候选区间。提出了以镜头叠化过程中图像灰度均值的变化特性为基础的叠化镜头检测方法。该方法根据叠化过程中图像灰度值均匀变化的特性,从而有效的消除了由于图像运动变化所产生的错误检测。实验结果表明,该检测方法对物体运动和摄像机运动具有较强的鲁棒性。给出了一种主要针对水平、垂直和对角线方向的划变镜头检测方法。该方法首先计算渐变候选区间内相邻帧的帧间差,对帧差图像进行Radon变换,计算每个变换方向上投影值的方差,寻找最大值,并记录其相应的投影位置和方向;通过跟踪该最大值的变化,从而检测镜头是否具有划变。结果表明该算法对划变镜头的检测具有较好的性能。利用本文所提出的镜头检测方法,建立了一种新的视频镜头检测系统。该系统利用非相邻帧间直方图差异检测镜头突变以及得到镜头渐变候选区间,并对候选渐变区间图像进行处理,利用本文给出的渐变镜头检测方法,判断镜头渐变类型。实验结果表明,该系统具有较好的检测性能,对视频图像中各种运动行为具有较强的鲁棒性。此外,由于系统对各种镜头转换的检测是同步进行的,其检测效率得到较大的提高。