论文部分内容阅读
在模式识别领域的特征提取过程中,流形学习是一项有效的降低维度的技术。它旨在保护给定样本集中各邻域结构。本文重点研究了近年来比较热门的特征提取技术,如:鉴别分析技术,流形学习技术和稀疏表示技术等。在学习过程中,我们发现传统的流形学习方法,如局部保留投影(locality preserving projection, LPP)算法等,都是保护以样本为中心的邻域结构。这种邻域结构虽然能够如实的反应初始样本间的近邻关系,但在其邻域内可能会存在过多的异类样本,这不利于最终的分类识别。因此,我们提出了一种新的基于子类中心邻域结构的方法,即子类中心流形保留投影(subclass-center manifold preserving projection, SMPP)。这种方法以样本集所分的各子类中心为邻域中心,建立邻域结构。我们通过理论证明了数据样本通常会呈现一种高斯混合分布,而分布的中心即为各子类中心,所以这种邻域结构内部会存在较多的本类样本。为了能够利用样本的类别信息,进一步提高识别效果,我们进而提出了鉴别的子类中心保留投影算法(discriminant SMPP, DSMPP)。不同于相关的鉴别流形算法,DSMPP建立一个双目标优化模式,并通过线性加权和方法将其解决。从而将子类流形结构信息和样本固有的类别信息融合在一起,达到在投影中既能够保留样本流形结构,又能够使得同类样本靠近,异类样本分开。特征提取技术希望能够在本过程中提取到尽可能多的有效信息,而一些稀疏表示方法的文章又提示我们,数据集中的各样本间含有这种互相稀疏表示的关系。因此,为了能够充分利用样本固有信息,我们提出了一种新的稀疏表示方法,即带有流形信息的稀疏映射(sparsity embedding with manifold information, SEMI)算法。这种算法首先将原始样本稀疏重构,得到重构后的新样本集。然后在投影过程中,保留新旧样本间的流形结构,从而达到能够同时保留样本间稀疏关系和流形结构的目的。我们在AR,FERET和CAS-PEAL数据库上的实验证明了在分类效果上,我们提出的方法相对于其他相关方法的正确性和有效性。