论文部分内容阅读
近年来多媒体技术和网络技术得到了蓬勃的发展,使得视频数据海量增加,同时由于视频数据的复杂性,传统的数据处理方式已经不能满足需求,如何从海量的视频中快速高效的检索出所需要的视频变得十分重要,于是基于内容的视频检索成为当前多媒体领域的研究热点。基于内容的视频检索通过对视频结构分析,将视频分割成关键帧、镜头、场景,最终以镜头为单位,根据用户提交的视频示例,在视频数据库中查找与其相似的视频片断,并根据相似度的高低给出检索结果。本文在综合分析了以往的基于内容的视频检索方法的基础上,提出基于权重颜色分量的镜头分割算法和基于粒子群的关键帧提取算法,具体内容如下:(1)本文在研究现有镜头边界检测方法的基础上,提出基于权重颜色分量的镜头检测算法。该方法选择HSV颜色空间作为特征描述空间,并且将该空间划分成三个子空间,分别为色调H子空间、饱和度S子空间、亮度V子空间。利用三个子空间在镜头转换类型中所体现出的不同特点,自适应的分配子空间权值,突出变化巨大的子空间,使得镜头边界处和镜头内部运动更加容易区分。最后通过实验验证算法的有效性。(2)考虑到视频中运动是关键帧提取的最主要依据,本文将运动划分为两大类:局部运动和全局运动。首先根据注意度模型提取视频左上角区域的光流特征作为图像的全局运动特征,同时提取图像中间区域的颜色特征作为局部运动特征,然后将全局运动特征和局部运动特征合成为图像的特征向量。之后本文分析了大量视频数据,选取出五类典型视频的特征向量,并且以典型视频特征向量为基本粒子通过粒子群算法自适应的提取镜头关键帧。实验结果表明该算法提取的关键帧可以有效的反应出镜头的主要事件并且冗余情况良好。(3)为了验证上述方法的有效性,本文采用面向对象的设计方法,以VisualC++6.0和OpenCV1.0为开发工具,实现基于内容的视频检索的原型系统。该原型系统主要包括:视频预处理、镜头边界检测、镜头关键帧提取、特征提取、镜头相似度计算、视频查询等功能。