论文部分内容阅读
目前随着多媒体和网络技术的迅速发展,海量的视频信息不断涌现,使得有效地对视频的分析和检索的要求日益重要。为此,在信息学科形成了一个全新的研究领域,即基于内容的视频检索(Content-Based Video retrieval,CBVR)技术。CBVR是指在视频分析的基础上,提取能够反映视频内容的各种特征,进而通过模式匹配从海量视频数据库中检索出相关的视频流。视频的内容包括视频的结构信息、低层次的视觉和听觉信息以及高级语义信息,所有这些都是后续理解和分析的基础。本文主要研究了视频时域分割问题,将整个视频划分为若干级的层次结构:场景、镜头、关键帧等。镜头分割是基于内容的视频检索中最基本也是最重要的一项内容,它的基本任务是根据相邻帧图像的相关性将视频序列分割成相对独立的基本单元一镜头,其精度直接影响到视频检索的成败与精度,能准确、快速分割出镜头,对视频分析和检索具有重要的影响。镜头分割分为压缩域和非压缩域两类,而镜头变换类型大致分为突变和渐变,其中渐变由于不同的视频剪辑方法具有多种表现形式。本文的主要工作有:(1)介绍了基于内容视频检索系统的主要技术及特点,着重介绍了基于内容的视频数据模型以及通用的视频结构化数据模型。(2)介绍了像素域和压缩域中的镜头分割方法。在像素域中传统的变步长镜头分割算法的基础上,本文提出了一种改进的变步长镜头分割算法,即检测突变的方法不变,在检测渐变的过程中融入双向阀值法。在镜头的表达方面,本文介绍了目前的几种关键帧提取的方法,并给出了对关键帧提取结果的评价准则。(3)在镜头分割和关键帧提取的基础上,本文进一步研究了基于镜头聚类的场景分割方法。在基于镜头边界的聚类算法基础上,提出了利用镜头帧图像的全局颜色特征和运动特征来分割场景的方法。并利用Visual C++6.0实现了一个简单的视频检索系统。