论文部分内容阅读
本文提出了基于图像特征的视频检索方法,是从视频图像特征的角度构建语义特征,进行视频数据的分割,实现基于内容的视频检索功能。本文对基于内容的视频检索关键技术进行了综述,提出了以镜头与关键帧的特征帧提取[1]为主的视频特征表示方法作为镜头分割点。
本文利用镜头变换的检测方法,提出一种改进的自适应镜头检测方法,采用双重比较技术[2],可以在渐变起始帧处进行阈值选择,同时对镜头间帧距离测定方法进行了修正,提高了镜头检测效率。
介于压缩域的镜头检测算法对于快速视频分析分割与检索的重要性,本文采用MPEG压缩过程中生成的DC图形进行检测,在视频特征的关键技术上本文对原有的模块匹配法做了很大的改进,原有的模块匹配技术中模板匹配的计算方法与像素的位置密切相关,因此用这种方法进行图像差别的计算对噪声和物体运动十分敏感。而改进后的方法不仅可以去掉图像中的一些噪音,并且对小的物体运动起到补偿作用。DC图像仅是视频数据中的一小部分数据,但却含有大部分信息,是原图像的缩微图像,而且处理速度比原图像要快得多。所以用DC图像不但可很好地进行镜头检测,同时可以提高处理速度。
在形状特征提取的方法中我们主要运用了傅立叶描述符,在文中我们用复数表示象素坐标,这种复坐标函数的傅立叶变换会产生一系列复数系数,这些系数在频率上表示了物体形状,其中低频分量表示形状的宏观属性,高频部分表达了形状的细节特征,形状描述符可以从这些变换参数中得出。
在视频特征的描述框架建立方面,给出XML描述框架,此描述框架包括:视频对象表;对象特征描述表;对象层次关系描述表。对对象间的时间、空间拓扑和方向性关系进行了描述。这种描述提高了视频特征与视频数据共享度。本文给出了一个基于图像特征的视频数据检索系统,实现对视频基于图像特征的检索。