论文部分内容阅读
随着数字图像数量的急剧增长,如何高效、快速地从海量图像数据中检索出用户所需的信息是当前图像应用领域的一个重要问题.20世纪90年代基于内容的图像检索(Content based image retrieval, CBIR)应运而生.基于内容的图像检索系统通过提取图像的底层特征,实现图像之间的相似度匹配.对图像内容的描述包括全局描述和局部描述,常见的全局描述子有局部二值模式(Local Binary Pattern, LBP),方向梯度直方图(Histogram of Oriented Gradients, HOG)以及颜色直方图等.全局描述子的鲁棒性较强,受噪声的影响较小.然而,在检索的过程中,根据人眼视觉感知特性,用户常常对图像中的某一目标感兴趣,提取图像的全局特征往往不能满足用户的检索需求.相对于全局特征而言,局部特征对单一目标的描述更为有力.然而,图像所蕴含的丰富内容是底层视觉特征远远不能表达的,如何减少图像的底层特征和高层语义之间的“语义鸿沟”是CBIR的重要研究课题.相关反馈是减小语义鸿沟的一种有效的方法,首先在信息检索中提出,20世纪90年代引入图像检索,并且证明能够很好的提高检索性能.相关反馈包括四个部分:(1)系统将初始检索结果中的最相似的前N幅图像返回给用户;(2)用户标注正例和反例;(3)通过用户标注的正例和反例来学习用户的检索需求;(4)将图像库的图像重新排序.首先,本文提出了一个基于自适应学习区域重要性的交互式图像检索系统,主要做了以下工作:一是为了减轻用户选择感兴趣区域的负担,我们提出了一个描述区域重要性(Regionimportance, RI)的指标.该指标综合考虑了人眼视觉特性和图像自身的特征.进一步地,该指标可以通过用户提交的反馈信息进行改进.基于提出的RI,一种改进的基于区域的相似度匹配算法被提出.二是为了进一步满足用户的检索意图,我们提出了一种反馈策略:自适应学习区域重要性(Adaptive learning region importance, ALRI). ALRI能够自动提高相关区域的RI并且同时减少不相关区域的RI.这一过程是通过调整用户提供的正例和反例图像区域的RI值实现的.实验部分采用了两个国际公开的图像库:Corel-1000和Caltech-256,并考察了我们提出的交互式系统的初始检索结果、反馈结果以及时间复杂度方面.实验结果表明我们提出的检索系统在检索性能和事件复杂度方面都是有竞争力的.其次,本文提出了两个基于粒子群优化算法的交互式图像检索框架,一个框架是只和用户标注的正例图像有关,另一个框架和用户标注的正例和反例都有关系.主要贡献是通过粒子群优化算法赋予用户标注的反馈图像在下一轮检索中的权重,从而获得新的检索向量,该检索向量更接近用户的检索意图.在Corel5000图像库上将我们提出的两个图像检索框架和其他的检索方法做比较,实验结果表明我们提出的方法有一定的优势.