论文部分内容阅读
图像检索,一直是近几年一个异常火热的研究课题,基于各种特征和编码方式的图像检索系统层出不穷。然而,由于一幅图像中包含多种类型的信息,要想较好的诠释一幅图像,仅靠单一特征很难实现,因此多特征融合的图像检索系统应运而生,用多种特征来描述一幅图像,能将图像的各种信息都包含进去,从而达到更高的检索精度。尺度不变特征转换(Scale invariant feature transform,SIFT),局部二值模式(Local Binary Pattern,LBP)和颜色特征是图像检索系统中常用的三种特征,在应对各类图像时都有很好的表现。矢量量化编码(Vector Quantization,VQ),费舍尔向量编码(Fisher Vector,FV)和局部线性约束编码(Locality-Constrained Linear Coding,LLC)在对图像特征进行编码时也有着优越的性能。本文以上述三种特征和三种编码方式为主要研究对象,以提高图像检索精度为目标,提出多种组合方案的多特征编码的图像检索并进行实验验证。主要研究内容如下:1.从单特征多编码的角度进行实验,使用一种特征和上述三种编码方式进行组合。首先提取待检索图像和图像库的一种特征,再利用K-means和GMM对图像库特征进行聚类生成字典。将待检索图像和图像库图像特征分别通过三种编码方式,在对应的字典上编码得到图像的向量表达。将待检索图像的向量和图像库图像的向量对应求出余弦距离,得到三种结果,将三种结果进行不同的组合得到最终检索结果。在Corel-1k数据集上的实验结果表明:使用SIFT特征在三种编码方式下的融合方案结果较好。2.从多特征单编码的角度进行实验,使用三种特征和一种编码方式进行组合。首先提取待检索图像和图像库的三种特征,再利用K-means或者GMM对图像库特征进行聚类生成字典。将待检索图像和图像库中图像的三种特征通过一种编码方式,在对应字典上编码得到图像的向量表达。将待检索图像的向量和图像库图像的向量对应求出余弦距离,得到三种结果,将三种结果进行不同的组合得到最终检索结果。在Corel-1k数据集上的实验结果表明:三种特征在FV编码下的融合方案结果较好。3.从多特征多编码的角度进行实验,使用三种特征和三种编码方式进行组合。首先提取待检索图像和图像库图像的三种特征,再利用K-means和GMM对图像库特征进行聚类生成字典。将待检索图像和图像库图像的三种特征分别通过三种编码方式,在对应的字典上编码得到图像的向量表达。将待检索图像的向量和图像库图像的向量对应求出余弦距离,得到九种结果,将九种结果进行不同的组合得到最终检索结果。在Corel-1k数据集上的实验结果表明:三种特征在LLC编码和FV编码下的融合方案结果较好。