论文部分内容阅读
人脸识别因其自然、非接触、直观、便捷等优点而倍受关注,是当今极具研究价值和发展潜力的一门生物特征识别技术,也是目前模式识别和人工智能领域的热点研究课题之一。因此对人脸识别技术进行研究具有重要的理论意义和应用价值。如何有效地从人脸图像中提取出具有鉴别力的特征,是实现人脸识别的关键性问题。研究表明,人脸在某种意义上属于一种流形结构,人脸数据集可以看作是由某些内在变量控制形成的非线性流形。基于子空间流形学习的人脸特征提取方法引起了人们的广泛关注。本文首先介绍了经典的流形学习算法,然后针对经典流形学习算法存在的问题,如流形结构中欧式距离的局限性、未考虑人脸样本类别信息和人脸数据可能呈现多流形分布结构等,对流形学习方法进行完善和扩展。最后通过在开放的人脸数据库上的仿真实验对本文所提算法的有效性进行了验证。本文的主要工作可概述如下:①在局部保持投影(Locality Preserving Projections,LPP)算法中,对人脸流形中数据的近邻结构仅采用欧式距离度量会产生虚假的近邻关系。此外,LPP以局部合并的方式来重构人脸数据的整体内在特性,无法较好地体现不同类数据间的分布差异。针对这些问题,本文提出了一种融合相关系数的局部保持投影算法(Correlation Coefficient Fused with LPP Algorithm,CCLPP),将数据类别信息以相关性方式引入到算法中,采用相关系数融合欧式距离的方式来构造和评价邻域图。CCLPP方法能很好的揭示人脸数据集的真实内蕴局部几何结构以及数据整体分布特性,在保持数据集邻域结构的基础上,扩大了不同类数据间的间距,进而改善数据样本的虚假近邻,新方法展现了良好的鉴别特性。②现有的流形学习方法均是基于单流形假设的,即认为所有的样本数据均分布在一个统一的低维嵌入流形上。相关研究表明,人脸数据可能呈现多流形分布,不同类别的人脸数据位于不同的流形上。若将位于多流形上的人脸数据在一个单一的空间上进行描述会影响对数据真实几何结构的估计。本文研究了多人脸流形分类框架,提出多邻域保持嵌入(Multiple Neighborhood Preserving Embedding,M-NPE)算法,将不同类别的人脸数据刻画在不同的低维流形上,且认为各类数据具有不尽相同的本质特征和维数。M-NPE算法首先通过NPE分别学习每类人脸数据的低维流形,然后采用遗传算法得到多个流形在分类意义下最优的一组维数,最后选用基于最小重构误差的分类器在多流形上对新人脸样本进行分类。在Extended Yale B和CMU PIE人脸库上的实验结果表明了算法的有效性。