论文部分内容阅读
信息科学技术的迅速发展和广泛应用,使非结构化的超高维数据大量涌现。这些高维数据往往成为模式识别和机器学习领域处理的难题。究其缘由在于:(1)所谓的“维数灾难”带来的技术难度;(2)维数太高所要求的存储量大和计算代价高。因此,有关数据降维方面的课题研究长期以来都是相关领域研究的重点课题。在过去的几十年里,有大量的降维(Dimensionality Reduction, DR)算法包括线性降维算法和非线性降维算法被不断地提出并被深入研究,其中常用的包括传统的线性降维算法如主成分分析(Principal Component Analysis, PCA)和线性判别分析(Linear Discriminant Analysis, LDA);几种经典的流形学习算法如局部线性嵌入(Locally Linear Embedding, LLE)、等距映射(Isometric Mapping, ISOMAP)、拉普拉斯特征映射(Laplacian Eigenmaps, LE)及局部切空间排列算法(Local Tangent Space Alignment, LTSA)。然而,现存的很多算法存在很多缺陷,如PCA不具有判别力,LDA受困于小样本问题,LLE等流形学习算法却无法应用于识别问题,等等。因此,本文的工作主要针对基于稀疏表征理论的降维算法问题进行研究,旨在得到有效可行的降维算法并将所得算法应用于人脸识别以提高人脸识别的性能。本文的主要研究工作如下:(1)对目前降维问题的研究背景及意义、降维技术的国内外研究现状及其目前所面临的挑战等作了综合分析;(2)通过引入类间权重矩阵和类内权重矩阵,本文提出了一种新的有监督线性降维算法——线性判别投影(Linear Discriminant Projection, LDP)方法。其一方面最大化各子流形间的分离性和最小化局部子流形的紧致性,另一方面还保持数据的局部近邻信息。同时,LDP克服了小样本问题。除此之外,LDP对outlier数据具有鲁棒性。(3)通过在近邻保持嵌入(Neighborhood Preserving Embedding, NPE)方法中引入类间散度和类内散度,本文提出了一种判别近邻保持嵌入(Discriminating Neighborhood Preserving Embedding, DNPE)方法。DNPE通过施加判别约束,增强算法的判别力,有效地提高人脸识别性能,增强了算法的实用性能;(4)受稀疏表征(Sparse Representation, SR)理论的启发,提出了一种新的基于稀疏表征的算法——稀疏判别近邻保持嵌入(Sparse Discriminating Neighborhood Preserving Embedding, SDNPE)。SDNPE算法在无需构造邻接图和计算权值矩阵的情况下,直接通过稀疏重构来计算权值矩阵,从而避免了因参数太多带来的局限性,改善了算法的识别性能。本文在ORL、Yale、AR和Extended Yale B四个人脸数据集上进行了仿真实验,实验结果证明了本文所提出的三种降维算法的有效性。