论文部分内容阅读
随着计算机、电子及信息技术的飞速发展,人们之间的信息交流变得越来越方便。海量的多媒体信息通过移动终端自由的传输和存储,由此带来的视觉信息爆炸问题日益严重。海量、非结构化的数字化视觉信息数据的管理、存储以及传输的难度越来越大,已成为目前人们检索和浏览信息的主要障碍。使用在文本中广泛应用的基于关键词的内容检索方法来对视觉信息进行处理,不但效率低,而且也不能很好的利用视觉信息中所包含的丰富知识。为此,相关专家和学者提出了基于内容的视频检索技术,其中,视频镜头边界检测和关键帧技术的提取是近几年来的研究热点。镜头边界检测是检索技术中要解决的首要基础技术问题,关键帧的提取是其中的核心技术之一。本文针对视频镜头边界检测和关键帧的提取方法进行研究和探讨,以期能找到一种能提高视频检索效率的方法。 镜头边界检测技术是基于内容的视频检索的基础,只有有效的获得分割的视频镜头,才能提取到能够充分代表镜头内容的关键帧。繁多的视频信息、复杂的视频种类以及视频编辑的手段增加了对视频镜头边界检测难度。本文将针对当前现有的一些镜头边界检测技术只能单一的针对某一特定领域的视频进行分割,扩展性能差的不足,提出改进算法。 视频关键帧提取技术是视频数据处理研究领域的热点研究问题。关键帧提取技术是基于内容的视频检索的核心技术之一,对于场景繁多、内容复杂、镜头变化较多的视频类型,现有的关键帧提取方法效果不是很好,直接影响视频检索的速度和准确性。 基于以上问题,本文主要做了以下几个方面的研究: (1)在关键帧提取之前要进行镜头边界检测。本文针对现有的镜头检测技术大多只能在某一特定领域内的视频中应用的不足,提出一种基于小波边缘检测算子的自适应分块视频镜头边界检测算法。结合小波边缘检测和视频帧的自适应分块方法,检测视频镜头变化,得到分割的镜头。 (2)对视频帧提取图像颜色特征、形状特征和纹理特征,通过归一化处理,得到融合颜色、形状、纹理多种特征的相似性度量值,作为衡量视频帧特征的标准。 (3)由于基因表达式编程有很强的全局搜索能力,在解决聚类问题时具有明显的优势。能够在完全不需要对数据集有任何先验知识的情况下对簇进行聚类分析,从而解决基于划分的聚类算法中需要预设簇个数的缺陷。本章利用基因表达式编程的自动聚类功能对视频帧进行聚类,改进并提出了基于GEP自动聚类的视频关键帧提取算法(KeyFrameClusteringAlgorithmbasedonGeneExpressionProgramming,KFC-GEP)。 (4)通过实验验证了的有效性,实验结果表明该方法能有效提高各种类型视频关键帧的提取精度。