论文部分内容阅读
特征提取作为模式识别研究的核心问题之一,在计算机视觉、图像处理以及机器学习等相关领域具有重要的理论研究意义和实际应用背景。至今为止,多元统计分析中的诸多方法已被成功应用于该领域,其中最具代表性的方法有主成分分析(Principal Component Analysis,PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)。PCA具有以下优点:各主成分互不相关,且主成分的维数低于原样本的维数,同时也保留了数据的重要信息。然而,主成分分析在实际应用中还存在一些问题,一是未有效利用标签信息,二是不能清晰地给出特征层面上的解释。线性鉴别分析可以在子空间学习过程中利用标签信息,以获得更具鉴别力的特征,其局限性在于只有当类内散度矩阵是非奇异时,才能通过特征分解来获得最优解以进行特征提取。虽然许多基于LDA的改进方法克服了这些限制并提高了特征提取与识别的性能,但是这些方法要么对噪声敏感,要么缺乏联合稀疏的特征提取功能。为了解决PCA与LDA所存在的问题,本文提出如下两个方法:(1)本文提出了一种基于SPCA的稀疏鉴别主成分分析算法(SDPCA),SDPCA通过将传统的最小二乘回归引入到SPCA的原始目标函数中,即可以利用先验知识来获得包含鉴别信息的主成分,又能保证投影向量的稀疏性,以提高特征提取的性能。(2)本文提出了一种基于最大边界准则的局部联合稀疏线性鉴别分析算法(LJSLDA),来利用局部邻域信息构造新的散度矩阵,从而提高鉴别分析的能力。LJSLDA不仅可以有效地避免LDA中存在的小样本问题,而且能够获得具有联合稀疏性的投影以进行有效的特征提取。本文提出的SDPCA与LJSLDA分别有效地解决PCA、LDA中存在的一些不足,并获取稀疏的投影以进行有效的线性特征提取。本文还给出了相关的理论分析,包括SDPCA与SPCA、LJSLDA与LDA的区别与联系。在人脸数据库、手写数字库及高光谱图像数据库上的实验验证了SDPCA与LJSLDA的有效性。