图像检索中的查询困难度预测研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:peace060606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业的快速发展,以及社交网络和多媒体分享网站的兴起,如何从互联网中海量的多媒体数据中快速准确的找到用户需要的信息变得异常重要。传统的基于文本的搜索技术在面对多媒体检索时往往显得不够准确,基于视觉信息的多媒体检索可以利用图像视频的内容来弥补文本检索的不足,对用户来说也更加直观和生动。基于内容的图像检索,即当用户输入一幅查询图像时返回数据库中与该查询图像视觉相似的所有图像,正在受到学术界和工业界的广泛关注。而随着词袋模型的出现,基于内容的图像检索向着实用的大规模应用不断发展。在词袋模型中,图像的视觉特征被量化为一个个与文档中词语相对应的视觉词语,因而文本检索中的成熟技术可以被广泛的应用到图像检索中来。  性能波动是信息检索中一个常见的问题。即使是性能良好的检索系统,在处理一些困难的查询时仍然会出现性能急剧恶化并远低于平均检索水平的情况。这类困难的查询不仅影响了检索系统的整体性能,而且会对后续的排序优化算法产生影响。如果可以对查询的困难度进行预测,并针对不同困难度的查询采取不同的检索策略,那么将可以有效的降低困难查询对全局性能的影响,并有效改善系统的检索结果。因此,对于查询困难度预测或者叫做查询性能预测的研究应运而生。当前的查询困难度估计研究主要集中在文本检索领域,事实上,在基于内容的图像检索中同样存在着性能波动的现象。如果可以区分出困难和简单的图像查询,并对不同难度的查询采用不同的检索策略,可以进一步改善图像检索的性能。  本文的研究集中在基于内容的图像检索中的查询困难度估计以及基于困难度指导的检索策略设计。概括起来,本文的主要贡献如下:  ●考虑到视觉词语与文档词语的类比性,本文从文本查询困难度估计算法入手,在考虑了图像查询的清晰度得分之后,通过度量图像查询与初始结果之间的空间一致性和视觉一致性,得到对于图像查询的困难度估计。  ●考虑到图像有更多的视觉特征可以利用,本文从图像的多视角特征入手,将基于流型学习的多视角降维算法进行线性化,以使其适用于实时的大规模图像检索应用。具体的说,首先利用数据离线的学习出一个降维矩阵,当得到查询图像的初始结果后,可以利用这个矩阵在线的得到查询图像及其初始结果的低维表示,并利用它们之间的一致性来衡量查询图像的困难程度。  ●由于图像查询的困难与否与查询本身、查询的相关图像以及数据库图像的分布三者都有关,本文提出从它们之间的一致性和突出性入手,利用上述的图像低维特征定义了一组描述图像查询困难度的特征,并利用排序学习的方法离线的训练得到不同特征之间的权重。在得到查询图像与初始结果之后,可以利用这一模型以及它们的低维特征计算得到当前图像查询的困难程度。  ●在得到图像查询的困难度之后,本文提出利用困难度指导依赖查询的排序优化策略的执行。具体的说,本文从三个方面设计了多个基于查询困难度的性能优化策略。从检索系统的角度出发,注意到重排序、查询扩展等算法的成功与否严重依赖于查询的初始检索结果的质量,因此本文提出在得到当前查询的困难度之后,只对难度适中的查询执行重排序和查询扩展,而避免在困难和简单的查询上执行算法,从而一方面可以在中等难度查询上获得性能改善,另一方面避免了不必要的性能恶化和系统开销。从用户的角度出发,本文提出将估计得到的图像查询困难度作为用户是否优化或替换查询的准则。对于困难的查询,用户可以通过框出目标物体来改善检索性能,而系统也可以通过考察初始结果作为查询的困难程度来向用户推荐恰当的查询。而在分布式检索中,查询困难度可以指导数据集选择、结果合并等重要的环节。在多个规模不同的数据库上的详细实验证明了本文提出的一系列图像查询困难度估计算法的有效性。而基于困难度的检索优化算法也取得了显著的性能改善。此外,通过对效率的分析,即使在百万张图像规模的数据集上,本文提出的图像查询困难度估计算法及困难度指导的优化算法都可以实时的进行,从而为进一步的实用提供了保证。  ●由于初始检索结果在查询困难度估计中发挥着重要的作用,本文从图像的视觉词语、空间结构、视觉特性出发,设计了一组图像排序特征,并应用文本检索中的排序学习方法改善图像检索结果的质量。在结合了特征选择策略后,排序学习检索模型显著改善了经典的向量空间模型的检索性能,从而为后续的查询困难度估计算法的研究和改善提供了基础。
其他文献
RPKI(Resource Public Key Infrastructure,互联网码号资源公钥证书体系)是一种用于保障互联网基础码号资源(包含IP地址、AS号)安全使用的公钥基础设施。通过对X.509公钥证书扩
形式验证的方法主要有模型检测和演绎推理两种。模型检测的优点是验证过程是自动的,缺点是具有状态爆炸问题,不利于处理大型系统。演绎推理具有可以处理无穷状态系统的优点,但验
在作为LTE-Advanced系统的一项关键技术的协作多点传输(CoMP)技术中,在地理位置上分离的多个传输点,协同参与为一个终端的数据传输或者联合接收一个终端发送的数据,从而降低
股市波动风险的复杂性和不可预测性很大程度上影响着投资者决策,容易造成选股不当、投资规模和比例配置失误,以至难以实现收益最大化。本论文旨在揭示中国股市波动性的特性、进
近年来,随着移动智能终端的普及和移动互联网的飞速发展,移动智能终端逐渐取代传统计算机平台成为人们的主要计算平台,渗透到人们生活的方方面面。在给人们生活带来巨大方便的同
物联网的概念和应用在近几年逐渐被人们所了解,作为一种有极大发展潜力的技术,整个物联网产业链将会产生数以万亿级别的利润,所以物联网产业必然成为了全世界各个国家所重点
信息物理融合系统是近年来研究的一个热点领域,它集成了计算成分和物理成分,这类系统具备计算、通信及控制行为能力,包含离散和连续混合特性,往往应用于安全攸关的领域,如智
微生物资源是世界上分布最广、种类最多的生物资源。目前全球有超过16万的微生物物种存在。它们与人类的生产生活密不可分,涉及到农业、林业、工业、医药等各个领域。人类对微
随着互联网络应用的快速发展,人们积极参与到了电子购物和网络社交活动中,通过论坛、博客、微博等分享自己的心情、观点和体验等。因此,互联网上产生了海量的主观性文本内容,这些
近年来多租户技术作为一种能够有效提高资源利用率和减少系统运行成本的软件架构技术越来越多地得到广泛应用,多租户技术要求不同租户之间保持数据和应用程序的隔离。隔离是