论文部分内容阅读
随着数码设备的普及,互联网的兴起,每天将产生大量数字图像。为了有效的存储、管理图像数据库,需要对图像库进行索引,按特定的需求检索图像。怎么根据数字图像的视觉内容有效地管理图像库是当前研究的一大热点。为此,基于内容的图像检索(Content Based Image Retrieval:CBIR)受到广大计算机视觉、机器学习等领域研究人员的广泛关注。经过十几年的努力,基于内容的图像检索依然有两个基本问题有待解决。首先,用于描述图像视觉内容的特征向量,如颜色、纹理、形状、空间关系等等,一般维数比较高。很多情况下都是从几百到几千,一般的机器学习方法不能在这么高维的特征空间学习。这就是所谓的“维数灾难”。其次,基于内容的图像检索中用于刻画图像视觉内容的低维特征与高层语义概念之间不存在直接的联系,这就是所谓的“语义鸿沟”。为了更好的揭示低维视觉特征与高层语义概念间的联系,本文提出一种基于拉普拉斯的学习方法,学习得到的语义子空间为基于内容的图像检索提供更强的判别表示。本文提出的方法在构建邻接图时,不仅考虑到表示描述信息的无类别的视觉相似性,而且包含了表示判别信息的语义相异性。充分利用这两种信息学习得到语义子空间。通过引入一个惩罚参数γ,本文提出建立一个差式约束优化问题。那么最优投影就可以通过矩阵的特征值分解求得。创建的邻接图用一个关系矩阵表示,这样,计算复杂度和计算量都比比保局投影和局部判别嵌入要小。另一方面,学习的得到语义子空间不仅具有保持局部几何特性,而且全局相关信息也得到很好地保持。以前相关学习方法都存在奇异性问题,而且不能确定学习后子空间的维数。本文提出的方法解决了这两个问题。本文侧重研究子空间学习方法在基于内容的图像检索中的应用,提出一种新的子空间学习方法——“语义判别投影”,通过学习描述信息和判别信息得到新的语义子空间。本文用一个图描述图像间基于内容的视觉特征的相似性,用另一个图表示图像间的语义相异性。接着,求解一个带惩罚参数的差式约束优化问题。本文提出的语义子空间学习方法避免了奇异性问题,而且能学习得到一个最优维。同样地,本文提出的方法也可应用于再生核希尔伯特空间,得到称为“核语义判别投影”的学习方法。随后,本文提出另外两种扩展学习方法——二维语义判别投影和通过相关反馈增量学习的方法。实验结果表明,本文提出的方法比当前其它学习方法具有更好的检索性能。最后,总结全文并探讨进一步研究工作。