基于镜头的视频检索方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:meishan802
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息网络时代的到来,海量的视觉信息在全球被采集、传输和应用。然而,视觉信息膨胀带来的问题却非常严重,很多领域由于对大量的视觉信息无法有效的处理而使采集的视觉信息闲置,造成了很大的资源浪费;另外,曾经的单纯基于文本方式的传统视频信息管理系统也暴露出了很大的局限性。如何有效的组织、表达、管理、查询和检索视频信息已成为迫切的需求,于是基于内容的视频信息检索技术便应运而生。本文研究的是基于镜头的视频检索,它是以视频镜头为基本的分析单元,根据相似性匹配的原则,从镜头库中找到符合用户需求的视频镜头。本文对基于镜头的视频检索的方法进行了研究。提出了采用镜头聚类的方法来组织视频镜头库的视频内容,并给出了基于镜头的视频检索系统结构,按照该结构进行的检索不仅可以降低相似度测量的复杂度,而且可以有效避免相关镜头的丢失,提高检索速度。在实现检索的过程中,采用了颜色特征和空间特征相结合的方法表示视频帧的内容,在此基础上,采用优化初始聚类中心的关键帧提取算法,初始的聚类中心由视频数据在空间的分布来决定,增加了聚类结果的稳定性,使提取的关键帧可以更加准确的反映镜头的主要内容;采用凝聚式镜头聚类的方法,无需在聚类之前给定构建划分的数目便可以实现镜头自动、准确的聚类,有效避免了镜头间相似度测量的逐一计算;在相似度测量方面采取了二次测量的方法,首先通过大阈值的筛选,测量出大致的检索范围,然后利用Hausdorff距离进行进一步的测量,直至得到满足用户需求的检索结果。该种相似度测量兼顾了镜头本身的相似性和用户的具体需求,提高了算法的实用性和有效性。最后,本文针对不同类型的查询镜头进行了检索实验,并进行了实验结果的比较,实验结果表明,本文检索方法的有效性和准确度均有较大的改善。
其他文献
为了实现对现场的运行设备进行实时的监视和控制,监控系统必须具备很好的实时性和稳定性。作为整个监控软件的核心支持,实时数据库将实时技术和数据库技术相结合,数据和事务
文字是表达人类思想和情感的重要载体,获取自然场景图像中的文字信息从而实现图像内容的理解,将为人们的生活提供极大的便利,因此场景图像中的文字定位和识别也一直受到学界业界
随着现代通信科学、计算机科学、空间科学、海洋科学、地球科学等学科在众多相关领域的交叉研究和集成应用的迅速发展,人们能更多地利用电波在电离层中的传播特性,来完成远距
人脸检测作为人脸信息处理中的一项关键技术,近年来在模式识别与计算机视觉领域中,已经成为一个受到普遍重视、研究十分活跃的方向。随着智能化信息处理技术的发展,人脸检测在身
传统医疗模式需要患者经历上医院、挂号、排队等候等一系列繁杂程序后才能得到医治。因此,人们期待通过科技可以提高医疗服务水平,优化就医程序。诸多学者已经尝试将新的信息
学位
近些年来,随着神经科学、信号处理、计算机科学等领域的不断地深入发展,作为这些学科的交叉学科——脑机接口,目前已成为了当前国际上科学研究的热门领域。脑机接口是一种不同于
浅海水声信道非常复杂,是一个时间-空间-频率迅速变化的信道,信道参数每时每刻都有很大的不同,通信条件非常恶劣。但是随着全球各国海洋资源开发的迫切需求,对水声通信系统的要求
雷达是对远距离目标进行无线电探测、定位、测轨和识别的电子设备,无论军用还是民用,都占据重要的位置。现代雷达不仅要求完成对目标位置,速度等信息的提取,而且要求对目标进
经济的迅猛发展,使得现金流量日益增大,一些单位,如银行、超市每天需要处理大量的人民币,并且需要从处理的人民币中分捡出破、残人民币以及污染面积较大的不宜流通的人民币,同时还