基于特征空间信息加权的图像检索技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:z178933143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的飞速发展,网络上的多媒体信息呈现爆炸式的增长态势。如何分类和检索这海量的多媒体数据,是人们的迫切需求,也成为亟待解决的问题。基于内容的互联网图像检索,正是应这一需求而生的计算机视觉关键问题之一,拥有重大的研究意义和广泛的应用前景。  由于互联网图像的数量极为庞大,种类和表示的内容极为丰富,如何使用尽量简短的数据表示单幅图像,以及快速和准确地计算海量图像之间的相似度,对图像检索的效果至关重要。传统的视觉词袋(BoVW)模型是解决这一问题的常用框架,然而,该模型的检索性能上仍然有着可以发掘与提升的空间,比如利用视觉词典对底层特征量化时引入的量化误差,视觉词典常用聚类方法的一些缺陷,视觉词典中视觉单词的适用性等。  为了解决上述问题,本文的研究从对视觉词典的使用上入手,对视觉词典应用于不同图像集合的可迁移性和特征空间中特征描述子的分布进行探究,利用特征分布信息对视觉词典中不同视觉单词的重要程度进行评估,提高了以图搜图框架的检索效果。本文的主要研究内容与贡献总结如下:  (1)本文研究了视觉词典的可迁移性。视觉词典的可迁移性指的是,利用某数据集产生的视觉词典,应用于其它数据集的检索效果。通常对视觉词典的分析仅仅集中于对视觉词典中视觉单词的数量多少的探讨。然而,视觉词典产生于哪个数据集合,也是十分重要的影响因素。我们通过实验,证实了这一现象的存在,并设计算法,提高了视觉词典的可迁移性。  (2)本文提出了基于特征空间信息加权的视觉词典方法。我们从产生视觉词典的常用聚类算法入手,分析和探讨了这些聚类算法的特点,考虑在聚类过程中利用特征空间中特征分布的统计信息,对视觉单词的重要程度进行衡量,来提高视觉词典的描述能力。该方法可以与传统的词袋模型和词频-逆文档频率(TF-IDF)加权方式紧密结合,提升视觉词典的可迁移性和视觉词袋模型的检索效果。
其他文献
中国古代建筑具有悠久的历史传承和辉煌的艺术成就,是中国文化中的一块瑰宝,对中国古代建筑进行建模研究是当前虚拟现实和计算机视觉领域的一项重要热点。古代建筑建模研究的成
计算流体力学(CFD)在航空航天等领域发挥着重要作用,该领域对先进CFD软件有着强烈的需求。随着计算技术的发展,众核构架计算机在大型计算机成为了主流。将CFD程序移植到众核构
本文对运动图像增强与网络环境下图像信息跨尺度分析与融合进行了研究。图像增强是指根据特定的需要突出图像中的重要信息,同时减弱以及去除不需要的信息。网络环境下图像信
随着互联网的不断发展,网络大众的视频消费需求不断增加。流媒体技术由于其具有边下载边观看的特点,能够满足用户快速观看视频节目的需求,已成为大众网络视频消费的主要方式。同
三网融合是指电信网、互联网和广播电视网三大网络通过技术改造实现物理层的互联互通,业务层的相互渗透,具体表现为在技术上趋于一致,且都能为用户提供语音、数据、图像等综
无线感知反应网络,由大量具有数据采集、处理、无线通信能力的微型低功耗感知节点及反应节点通过多跳通信的方式组成,协作完成大规模复杂的监测和控制任务。由于无线感知反应
当前人们享受信息化带来的便利的同时也深受海量数据难以管理的困扰,个人文件同步系统的产生和发展为这个问题带来一个比较好的解决办法。这种文件同步系统通过将个人文件夹内
当今社会互联网技术的飞速发展以及与电信网络不断融合的背景下,VOIP技术在互联网中变得也来越重要,网络中对传输语音视频数据的需求在不断增强。互联网的飞速发展加速了互联
近年来新型社交媒体微博客平台高速发展,已经逐渐成为人们分享、获取信息的主要方式。由于微博客平台用户量急剧增多,用户产生的数据总量呈现爆炸式增长,基于这些信息的突发话题
随着以DropBox、EverNote等为代表的云存储服务的兴起与不断发展,云存储平台在存储数据方面的可靠性、易用性使得个人信息正在不断从传统的存储介质向云存储转移,云存储平台正