论文部分内容阅读
人脸识别是目前人工智能领域内一个重要的研究方向。在人脸识别问题中,训练样本的维度过高而样本数相对较少往往会导致维度灾难,从而影响识别效果。研究能够充分提取数据中判别信息的降维算法,并根据人脸数据的特点设计有效的分类器是一个具有重要研究价值的课题。
本文围绕一些经典的降维与分类算法,特别是子空间分析和最近邻分类展开分析和研究,给出了一种新的判别准则用于解决基于核的子空间分析中存在的一些问题,并提出了用于数据降维的分组变量方法及基于多个训练样本的回归最近邻分类等算法。
论文首先对人脸识别领域的一些经典方法和近期发展进行了总结,然后综合的比较和分析了目前广泛应用的降维和识别算法。特别的,我们着重对降维算法里面常用的各种子空间分析方法进行了讨论和数值实验。
基于核函数的各种算法是子空间分析中一个热点。针对基于核函数的子空间分析方法中存在的一些问题,如核函数的选取及算法中的奇异问题,本文进行了一些讨论和探索,得到了在核判别分析中出现过拟合的原因。为了解决该问题,我们首先利用多个核函数生成一个大的希尔伯特空间,在此基础上提出了一种新的判别分析准则;通过该准则我们将寻找最优核函数组合的过程与判别分析过程本身融合在一起。利用对解空间的限制,该方法不仅避免了求解过程中的奇异值问题而且也一定程度上解决了以往核方法所存在的过拟合问题。
结合子空间分析的技巧及人脸图像的一些特性,本文还提出了一种基于分类变量的数据降维算法。该方法先利用训练样本将变量分成不同的类;接着在各类变量所组成的子数据集中进行进行降维以消除冗余信息并得到每类变量的新的低维表达;最后再将降维后的各组数据综合起来,得到最终新的数据。从理论上讲,变量分类方法是一种具有稀疏性质的特征选取算法;另一方面,我们还在各个人脸库上对该方法和其他常用算法进行了比较,所得的实验结果表现出该算法具有一定的优越性。
此外,本文还对人脸识别中最常用的最近邻分类算法进行了研究。我们提出一种回归最近邻方法,通过回归模型将每类测试样本到给定类别的距离转化成回归残差,并把该距离信息整合到最近邻分类器中。采用这种回归最近邻的算法框架,我们将该方法扩展到非线性空间中,提出了核回归最近邻方法。该方法不仅极大地促进了最近邻分类的效率,同时也在人脸库上的对比试验取得了较好的结果。