论文部分内容阅读
图像检索是图像处理领域十分热门的一个研究方向,到目前为止已经经历了几十年的研究历程,涌现出了无数的研究成果,并且在当今社会得到了广泛的应用。图像检索技术主要分为图像特征提取和相似度匹配两部分内容,为获得精确的检索结果,首先要提取最佳的图像特征,其次要选取最合适的匹配方法,两者缺一不可,因此本文致力于这两方面的研究,在现有算法的基础上做了改进与升华。本文的主要研究内容为基于高层语义特征的图像检索算法。众所周知,图像底层视觉特征与高层语义特征之间存在的“语义鸿沟”现象是图像检索领域一直难以克服的问题,影响着图像检索技术的发展,所以如何解决这一难题,提高图像检索的准确性成为了本文的研究重点。本文首先介绍图像检索的背景、意义以及国内外发展现状,其次阐述本文所用相关算法的原理,紧接着提出了两种基于高层语义特征的图像检索算法:基于融合信息和标签投票策略的图像检索以及基于多目标区域的图像检索。针对“语义鸿沟”现象,本文采用了现下十分流行的卷积神经网络算法,并结合图像的类别概率,提出了一种基于融合信息和标签投票策略的图像检索算法。该算法首先使用卷积神经网络分别提取图像的高层特征和类别概率,之后将两者加以融合,在相似度匹配过程中,结合了标签投票策略,根据投票得分将检索结果进行排序。在三个熟知的图像数据集caltech101、caltech256和corel10k中进行实验,结果表明,与传统算法相比,本文算法在三个数据集上的检索查准率都有较大提升,mAP值的提升幅度为21.8%—59.65%,说明本文所提算法可以有效地提升图像检索的准确性。同时本文还针对传统的基于目标区域的图像检索算法不能很好地处理多目标检索问题,提出了一种基于多目标区域的图像检索模型,实现了一款高效的检索算法。首先借助于目标检测算法定位出图像中的目标,之后使用卷积神经网络提取各个目标的特征,最后采用新提出的多目标区域相似度测量方法计算其与数据库图像的相似度并返回检索结果。在两个数据集PASCAL VOC2007和PASCAL VOC2012中进行了实验,以返回结果包含全部目标视为准确检索,结果表明,本文所提算法与其他的基于目标区域的检索算法相比,在两个数据集中mAP值的提升幅度为17.36%—35.51%,说明本文所提算法在多目标图像检索任务上性能更佳。