论文部分内容阅读
基于内容的图像检索直接从图像本身提取能够描述其内容特点的图像特征,并将其用于图像间的相似性度量,已成为当前计算机视觉领域的一个研究热点。更重要的是,基于内容的图像检索有助于构建客观、自动、高效的图像检索系统,对于管理互联网所产生的海量图像数据具有十分重要的意义。总体而言,图像特征可概括为颜色、纹理、形状和局部不变特征,与其他特征相比,局部不变特征具有良好的区分度,对于图像变换具有不变性且其对图像遮挡表现出一定的鲁棒性。由此,局部不变特征被广泛应用于图像配准、目标识别、图像检索等计算机视觉领域中。本论文主要研究基于词袋(Bag-of-words)模型与Fisher Kernel的局部不变特征融合方法,对这些方法进行分析与总结,进而针对现有算法中出现的问题采取相应的改进方法,并将改进后的算法应用于图像检索中。本论文的主要工作和贡献如下:1.研究基于局部不变特征图像检索的一些知识要点,主要包括局部不变特征提取技术、基于局部不变特征的图像相似度度量以及图像检索性能的评价标准。2.研究词袋模型的理论知识以及基于词袋的局部不变特征融合方法,并根据该融合方法中存在的缺点,采取如下改进方法:1)运用Kd-Tree近似最近邻查找算法提高特征编码的效率;2)运用ZCA白化方法降低编码系数各维度间的相关度;3)运用幂律归一化方法平滑图像表示向量,降低频率较高的图像内容比重;4)运用稀疏自编码器对图像表示向量进行优化,进一步去除向量间的冗余信息同时增强其描述能力。通过实验验证,改进算法的检索性能有较大的提高。3.重点研究和分析基于Fisher Kernel的局部不变特征融合方法,并提出基于局部约束线性编码的费希尔向量。首先,针对高斯混合模型在高维数据空间存在的局限性,运用稀疏表示模型建模局部描述子的产生过程,推导出联合稀疏表示模型与Fisher Kernel模型的费希尔向量表达式;其次,针对稀疏编码存在的计算效率低、缺乏空间结构信息等问题,利用局部约束线性编码算法代替其计算编码系数;最后,用改进的白化方法对高维的图像表示向量做降维处理,同时降低向量维度间的信息冗余度。Holidays与Oxdford5K数据库上的实验结果显示,在低维度表示向量的前提下,改进算法的检索效果要优于其他方法。