论文部分内容阅读
半监督学习以及子空间分析方法是当前机器学习和模式识别学科极为重要的研究方向。传统的有监督学习在学习过程中仅仅使用了训练样本中少许的有标签样本,传统的无监督学习在学习过程中利用了训练样本中大量的无标签样本。相比于传统的监督学习与无监督学习方法,半监督学习在学习过程中能够同时利用训练集中的有标签样本以及无标签样本,其学习目的是在少许有标签样本以及大量无标签样本的情况下,怎样改善有监督学习的泛化性能以及非监督学习的高效性。因此,深入研究半监督学习这一重要课题,意义十分重大。迄今为止,很多学者提出了众多的特征抽取方法。然而,子空间分析方法由于其描述性能强、计算简单、使用方便以及可分性好等特点,受到很多学者广泛关注。目前,已经成为研究人脸识别的一个重要方法。需要指出的是,人脸图像很容易受到许多外界因素的干扰,如何有效地在图像中获取丰富信息,已成为许多学者和研究人员继续探讨的问题。本论文主要以线性子空间特征抽取为研究目标,重点以半监督学习为研究手段,进行了如下几方面的研究:(1)自适应近邻选择的半监督判别分析算法(adaptive neighborhood selection semi-supervised discriminant analysis algorithm, SSD-an)在现有的流形学习算法中,针对在构建数据间的局部邻域时对参数的选择比较敏感和人脸识别的实际应用中有类别标签样本不足问题,提出了自适应近邻选择的半监督鉴别分析算法。样本间的局部邻域通过自适应地缩小或者扩大近邻系数来构造,有效保留了流形局部线性结构。同时,还可以充分利用有类别标签样本的监督信息,进一步挖掘隐藏在无类别标签样本中的潜在判别信息,有效地保持了样本的局部和全局信息,具有很好的分类和识别性能。FERET和ORL人脸数据库上的实验结果与分析表明,算法SSD-an有效地完成了特征抽取和分类识别,相比于传统的特征抽取方法,提高了识别率,更具有有效性。(2)局部重构和非相似度保持的半监督降维算法(local reconstruction and dissimilarity preserving semi-supervised dimensionality reduction algorithm, LRDPSSDR)为了将训练样本间的局部特征和全局特征有效地运用到子空间分析方法中,提出了一种局部重构和非相似度保持的半监督降维算法。在学习过程中充分利用了有类别标签的样本和无类别标签的样本,通过最小化局部重构误差设置邻接图的边权值,保持了局部几何结构。此外,样本间的非相似度通过最大化全局散度矩阵来表示,样本间的全局流形结构得到了很好的保持。Yale和AR人脸数据库上实验结果与分析表明,与传统的特征抽取方法相比,算法LRDPSSDR的识别性能更好且鲁棒性较高。(3)半监督的稀疏保持二维边界Fisher分析降维算法(smei-supervised sparsitypreserving two-dimensional marginal fisher analysis dimensionality reduction algorithm, SPP2DMFA)针对样本集中类别标签样本不足的问题,提出一种半监督的稀疏保持二维边界fisher分析降维算法。首先基于图像矩阵进行降维,图像像素间的空间结构信息得到了有效的利用。然后根据有标签样本设计类内散度矩阵和类间散度矩阵,以保持样本间的类间分离性和类内紧凑性。最后通过稀疏保持对特征间的稀疏重构性加以约束,所获得的稀疏重构权重保持了样本的局部几何结构,而且也包含了无标签训练样本中的自然鉴别信息。AR, ORL和Yale人脸数据库上的实验结果与分析表明,算法SPP2DMFA取得很好的分类和识别性能。