论文部分内容阅读
流形学习和稀疏表示是计算机视觉、模式识别与图像处理领域中的研究热点,近年来受研究者的广泛关注。其中,流形学习的基本假设是图像在高维空间的特征表现往往蕴含着低维流形结构。图学习作为典型的流形学习方法,它可以通过描述样本之间的相互关系来揭示高维数据中的潜在低维表示,其已成为众多领域的研究热点。而稀疏表示是一种对原始信号的分解过程,该分解过程借助一个事先得到的过完备字典,将输入信号表示为具有较强鲁棒性和判别性的字典线性近似。近年来,一些研究者融合流形学习与稀疏表示两者优点提出了许多机器学习算法,并在计算机视觉与机器学习诸多领域中取得成功应用。受这些方法启发,本文以稀疏表示构造数据关系图作为研究切入点,利用局部保留映射、非负矩阵分解、线性判别分析、协同表示等技术,融合子空间学习和稀疏表示方法,提出了四种稀疏图子空间学习算法。较为系统地研究稀疏图子空间学习算法提出动机、原理和性能特性,并应用于图像特征提取、图像聚类和图像分类之中,以测试算法有效性。 本研究主要内容包括:①提出了稀疏图正则化非负矩阵分解(SGNMF)算法。与传统近邻方法构建的图相比,SGNMF通过稀疏表示构造稀疏图,提高了同类样本的相似度同时抑制了不同类样本的关联,使得SGNMF具有更好噪声鲁棒性与样本相关关系刻画能力。SGNMF弥补了非负矩阵分解在模式识别和数据挖掘等领域应用中没有考虑数据内蕴几何结构的不足。②提出了稀疏图正则化线性判别分析(SGLDA)算法,其融合了稀疏表示与线性判别分析(LDA)良好特性。在 LDA基础上 SGLDA增加由所有数据样本构成的正则项,该正则项为子空间的学习提供一个良好的预先参考,可准确地刻画数据的几何结构,使得SGLDA能够克服LDA算法在处理小样本及非线性结构数据问题上容易受到所选标签样本的影响,更好地解决数据小样本问题。同时SGLDA算法利用了稀疏表示来刻画样本之间数据结构关系,可增强算法的判别性以及对噪声数据的鲁棒性。③提出了类引导稀疏保留投影算法(CGSPP)。鉴于原有的稀疏保留投影算法(SPP)和局部保留投影算法(LPP)只保留样本之间相关关系而忽视类别之间的全局相关关系的不足,CGSPP算法引入类别之间相关性的约束和类别之间的相互关系,构建了类别关系图,不仅汲取 SPP算法优点,而且将更多有用的原始数据保留到投影空间中,从而增强所提取特征的鲁棒性和判别能力。④提出了协同稀疏保留投影算法(CSPP)。该算法结合稀疏保留投影(SPP)和协同图嵌入(CGE)的优点,利用CGE模型引入??范数协同约束项,把SPP算法归结为一个协同表示模型。这样,CSPP算法兼具稀疏表示和协同表示的特性,使得回归系数更平滑,模型的求解难度降低,从而提高了模型在应用时的计算效率、鲁棒性与判别性。