论文部分内容阅读
互联网和多媒体技术日新月异的发展丰富了现代人的生活,以往单调乏味的文本信息已经逐渐被生动形象的数字视频所代替。毋庸置疑,融合了文本信息、音频和视觉信息的数字视频被广泛应用于影视、体育、教育、医疗等各个领域,已经渐渐成为了网络世界人们传递信息的主要方式之一。但是,由于数字视频的内容丰富、数据结构复杂且数据量非常大等特点,能否在海量的视频中快速检索到需要的视频,已经成为亟待解决的问题。视频镜头分割和关键帧提取作为视频检索技术中最基础也是最重要的核心步骤,一直是众多专家学者研究的热点。本文主要对镜头分割和关键帧提取中涉及的相关技术进行了研究和改进,并取得了一定成果。1.研究了提取图像特征的方法,提出了一种基于HSV颜色空间和非均匀分块权重的特征提取方法。首先将图像的RGB颜色特征转换为HSV颜色特征,并将颜色特征非均匀量化成72维的特征向量。然后对图像非均匀分块并对中心部分赋予较大权值。这种方法考虑了图像的整体特征,同时也突出了图像中心的重点内容。2.研究了帧间相似性度量算法,提出了基于Tsallis熵的帧间相似性度量算法。这种算法将Tsallis熵与Jensen公式结合,构造了基于Tsallis熵的距离度量公式,可以对连续帧的72维特征向量直接计算帧间距离。3.研究了镜头分割算法,提出了用滑动窗口优化阈值的镜头分割算法,在滑动窗口内,使用较大的阈值对突变镜头进行检测,较小的阈值对渐变镜头进行检测。对于检测出的突变镜头,采用间隔帧的帧间距离再次进行闪光检测,避免由闪光灯引起的误检。4.研究了关键帧提取技术,提出了改进层次聚类的关键帧提取算法。首先使用层次聚类得到关键帧的初始聚类结果,然后用K-Means算法优化初始结果,最终提取距离聚类中心最近的图像帧作为视频的关键帧。这种算法对初始聚类中心和聚类数目不太敏感,又兼具了K-Means算法收敛速度较快的优势。