论文部分内容阅读
互联网信息时代,基于Web2.0环境的社交媒体日益兴起,图像、视频等海量数据的共享已成为现实。面对网络环境下海量图像的搜索需求,建立快速有效的图像检索系统有着重要的实际意义。然而由于图像的低层视觉特征和高层语义概念之间语义鸿沟的存在,图像检索结果往往不能很好地反映用户的检索意图,针对此类问题,图像重排序技术综合图像视觉内容、用户反馈等额外信息,挖掘用户的检索意图,调整初始检索结果中图像的顺序,从而显著提高检索的精确性。本文以网络海量图像为研究对象,以用户检索意图挖掘,图像语义属性学习为关键技术,对图像检索重排序算法进行了研究,提出了两种基于图像语义属性相关性分析的图像重排序算法。综合应用了图像特征提取、图像语义属性学习、查询相关性分析、字典重构学习等技术。论文的主要内容如下:首先,基于图像的语义属性特征,提出了一种基于视觉语义字典联合学习的图像重排序算法,通过建立图像局部特征与语义属性之间的映射关系,对用户检索意图进行相关性分析,进而分别从语义角度和统计角度估计每一维视觉特征的重要性;在计算待检索排序图像与用户反馈查询图像相似性分数时,重点关注与用户检索意图相关性大的视觉单词的匹配程度,削弱无关视觉单词的匹配程度,从而弥补语义鸿沟造成的影响,进而提高检索结果排序的性能。实验结果表明此算法在相当程度上提高了图像检索排序结果和用户检索意图的匹配程度。其次,本文提出了一种基于分层语义学习的图像重排序方法,从图像低层语义属性出发,建立图像的分层语义表示模型,每一层的输出作为下一层的输入,通过学习算法得到不同层次的图像潜语义概念分类器,从而建立基于分层语义模型的图像语义内容表示方法。结合对基于视觉匹配图像检索排序结果的相关性分析,挖掘用户的检索意图,分析分层语义模型中每一层潜语义概念的相关性权重,从而得到更准确的图像相似性度量方法,弥补语义鸿沟问题造成的影响,进而改善最终检索排序结果的准确性。实验结果表明此算法明显提高了图像检索排序结果的准确率。