论文部分内容阅读
伴随着数字媒体技术的迅猛发展,加之各类社交平台的盛行,数字图像的种类和数量呈爆炸式增长。基于内容的图像检索(Content-Based Image Retrieval,CBIR)作为一种能够从海量图像中快速有效地检索出用户感兴趣内容的重要手段,备受学术界和工业界广泛关注。然而,图像的高层语义与其底层的视觉内容之间存在的语义鸿沟,使得CBIR很难达到实用化的要求。为此,研究人员提出了交互式检索方法——相关反馈机制,旨在将用户对图像视觉内容的主观感知加入检索过程中,使得检索结果渐进式收敛至其真实查询意图,以期缩小语义鸿沟。但是,用户通常不愿意花费时间向检索系统提供充足的(显式)反馈信息,这种交互式检索方法可行性并不高。图像数据库的点击日志中包含大量的用户对图像的(潜在)评价信息,作为相关反馈的替代品,近年来逐渐成为缓解语义鸿沟问题的主流学术思路。本文利用用户点击日志对图像检索系统中的两个关键环节(视觉特征描述、相似性排序)进行了有效改进。所取得的创新性研究成果可概括如下:(1)针对互联网图像往往具有复杂背景信息,而现有主流视觉特征描述方法(如视觉词袋模型)难以对其进行准确表达和有效检索等技术问题,提出一种基于同兴趣近邻投票的视觉特征提炼算法,该方法包括:针对待分析图像,首先根据查询日志特征,计算其同兴趣近邻图像;然后根据同兴趣近邻图像中视觉单词的分布情况,对待分析图像的每个视觉单词进行投票;最后从待分析图像的视觉词袋中删除那些得票数过低和过高的视觉单词,以达到特征提炼的目的。实验结果表明,通过同兴趣近邻投票凸显了图像中那些用户感兴趣的视觉内容,增强了视觉特征的区分度并改善了图像检索质量。(2)针对图像检索系统中有标记样本难以获取,进而影响相似性学习算法泛化性能不佳的现状,提出一种基于日志填充的改进图排序(CGVR)方案,该方法主要包括两个部分。首先借助协同过滤(Collaborative Filtering)技术,提出一种点击日志填充方法(CCV),以缓解点击日志稀疏性问题;然后基于经典流形排序(Manifold Ranking)技术,提出一种软标签图排序(GRS)算法,以降低点击日志中的噪声对排序结果的影响。实验结果表明,日志填充有助于改善图排序结果,所提出的CGVR方法较之传统相似性排序方法优势明显,有效改进了图像检索中的相似性排序效能。