基于图的视频检索

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xingyunzhixingkirk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码采集设备的普及和多媒体技术的发展,互联网上的视频数据急剧增长。面对海量视频数据,如何进行视频的存储、组织、管理和分析,已经成为视频领域最主要的方向。目前处在实用阶段的视频搜索引擎都是基于文本策略的,如Google Video Search、Yahoo Video Search、Bing Video Search和百度。然而视频呈现多样化的形式、丰富的语义,通常是难以用语言工具完整描述和表达的,为了解决这种文本检索的缺陷,基于内容的视频检索技术被提出,国内外的很多大学、研究机构纷纷加入进行相关的研究。聚类是视频分析中经常用到的方法。本文将现有的聚类算法划分为五大类:划分的方法、密度的方法、层次的方法、网格的方法和以仿射传播为代表的聚类方法,并总结了他们的优缺点。其中Kmeans是最典型的聚类算法,因其简洁、快速而被广泛使用。针对传统Kmeans算法对初始聚类中心敏感和聚类参数K难以确定的问题,本文提出了一种基于关联图划分的Kmeans算法。该算法能够有效地根据数据的分布特性选取初始聚类中心,能够在指定的数据密集程度下自适应确定聚类数目。大量的实验表明上述改进的Kmeans算法具有较高的准确率和稳定性。视频是一种非结构化数据,如何组织视频库是视频检索的首要工作。建立视频数据库的索引技术是这方面的主要方法。第三章中首先描述了优化的基于内容的视频检索框架,包括四部分:视频库模块、查询模块、检索模块、检索结果优化模块;其次对视频作结构化处理:通过镜头分割算法将视频划分成镜头,再通过基于关联图划分的聚类算法将镜头聚类生成若干个镜头簇,并计算镜头之间、镜头簇之间的相似度。同一个镜头簇内的镜头在视觉上具有一致性。层次结构是信息组织的一种重要方式,本文采用层次结构组织镜头簇,描述了一种粗查询与精查询相结合的二级查询机制:粗查询阶段以镜头簇为基本单位,进行近似查询;精查询阶段,展开镜头簇,在镜头级别上比较,查找最相似的前k个镜头。这种二级查询机制较大程度上压缩了数据量,减少了访问的数据集和比较的次数。大量实验表明,本文建立的层次聚类索引技术有较高的查全率、查准率和较快的检索效率。一个良好的视频检索系统,不仅期待能够返回正确的相关的视频,而且还希望返回的结果是简洁的。视频数据库中往往存在大量的冗余视频,特别是在同一个索引目录下的视频有极大的相似性,甚至存在一个视频的多个拷贝副本。如何提高视频检索结果的简洁性是本文的另一个出发点。针对视频拷贝的特性,本文提出了一种基于二部图匹配的镜头相似度度量方法。算法首先提取了两个镜头的关键帧序列,提取颜色直方图作为关键全局特征、Harris角点作为局部特征,通过构造二部图,寻找二部图的最大匹配序列,从而计算出镜头之间的相似度。结合上文提出的视频数据库的聚类索引技术和二级搜索机制,在粗查询阶段,进行镜头簇级别的拷贝检测,在精查询阶段,采用基于二部图匹配的镜头相似度度量方法,计算镜头之间的相似度,与给定的阈值做出比较,从而判断出是否为源视频的拷贝副本。实验证明了本文提出的视频拷贝检测算法对亮度变化、画面噪音、不同帧率、添加字幕等拷贝类型有较好的检测效果。
其他文献
随着信息技术的发展,Web应用方式越来越受到用户的青睐。Web应用软件规模越来越大,构架越来越复杂,开发人员需要通过性能测试了解系统运行过程中的性能表现与资源消耗模式。性能
进入到21世纪后,SARS和甲型H1N1流感相继在全世界范围大规模爆发,人民的生命财产安全受到严重威胁,我们面临的形势十分严峻。国内外很多专家学者在传染病预测方面做了大量的研究
随着计算机在当前社会各行各业的广泛应用和Internet的飞速发展,网上的信息量呈几何级的飞速增长。本体作为一种能从知识和语义层次上表达信息的工具模型引起了重视。由于本
随着出版业与互联网的不断发展,读物领域的信息爆炸现象日益突出,如何帮助用户在大量读物中找到喜欢的读物成为亟待解决的问题。因此,能够帮助用户快速找到感兴趣读物的读物推荐
随着软件系统规模的不断增长,如何为软件开发过程提供高质量的软件需求规格说明日益受到业内人士的重视。业内研究人员不断探寻合理评价软件需求文档质量的模型和方法,期望能
随着我国经济与科学技术的发展,业主对住宅质量、生活质量的要求也越来越高。业主逐渐开始关心居住周边环境、安全卫生、信息流通、物业管理等方面。可见在不久的将来,新的由计
随着科学的进步,信息技术得到了快速发展及广泛应用,高维数据应运而生,如医学图像处理、计算生物学、全球气候模型等,高维数据难以被现有的机器学习和数据挖掘算法进行有效地
随着Web应用不断发展,作为Web应用系统的核心的数据库系统的性能问题受到很大的关注。如何能够利用数据库自适应技术,从商业价值的角度考虑数据库资源的利用,更有效分配数据库资
现今,分类技术作为数据挖掘领域中一项重要技术,不仅应用在机器学习、模式识别等科学研究中,也广泛应用在实际生活中的各个方面。一个分类器可以被付诸应用的前提是此分类器性能
随着Web服务的广泛应用与推广,Web服务技术已成为下一代面向服务计算的有效解决方案。但是网络上存在大量具有相似功能而非功能属性不同的服务,这样如何从这些海量的服务中快