论文部分内容阅读
随着信息网络时代的到来,海量的视觉信息在全球被采集、传输和应用。然而,视觉信息膨胀带来的问题却非常严重,很多领域由于对大量的视觉信息无法有效的处理而使采集的视觉信息闲置,造成了很大的资源浪费;另外,曾经的单纯基于文本方式的传统视频信息管理系统也暴露出了很大的局限性。如何有效的组织、表达、管理、查询和检索视频信息已成为迫切的需求,于是基于内容的视频信息检索技术便应运而生。本文研究的是基于镜头的视频检索,它是以视频镜头为基本的分析单元,根据相似性匹配的原则,从镜头库中找到符合用户需求的视频镜头。本文对基于镜头的视频检索的方法进行了研究。提出了采用镜头聚类的方法来组织视频镜头库的视频内容,并给出了基于镜头的视频检索系统结构,按照该结构进行的检索不仅可以降低相似度测量的复杂度,而且可以有效避免相关镜头的丢失,提高检索速度。在实现检索的过程中,采用了颜色特征和空间特征相结合的方法表示视频帧的内容,在此基础上,采用优化初始聚类中心的关键帧提取算法,初始的聚类中心由视频数据在空间的分布来决定,增加了聚类结果的稳定性,使提取的关键帧可以更加准确的反映镜头的主要内容;采用凝聚式镜头聚类的方法,无需在聚类之前给定构建划分的数目便可以实现镜头自动、准确的聚类,有效避免了镜头间相似度测量的逐一计算;在相似度测量方面采取了二次测量的方法,首先通过大阈值的筛选,测量出大致的检索范围,然后利用Hausdorff距离进行进一步的测量,直至得到满足用户需求的检索结果。该种相似度测量兼顾了镜头本身的相似性和用户的具体需求,提高了算法的实用性和有效性。最后,本文针对不同类型的查询镜头进行了检索实验,并进行了实验结果的比较,实验结果表明,本文检索方法的有效性和准确度均有较大的改善。