论文部分内容阅读
人脸识别是一个古老而又年轻的学术问题,人们对它的探索已经跨越了三个世纪。早在1888年,《Nature》杂志首次发表了利用人脸进行身份识别的文章,掀开了人类对人脸识别探索的序幕。120年后的2008年,《Science》杂志刊登了关于“100%自动人脸识别精度”技术评论,指出现实环境下的高精度人脸识别仍然是一个遥远的目标,需要我们持续开展创新的研究工作。人脸识别是一个特殊的复杂模式识别问题,它具有:1)训练集合的高维性和小样本性;2)图像的类内变化远大于类间变化;3)特征空间内样本的结构复杂等特点。然而,现有的识别算法大多从特定目标函数出发,缺乏对人脸自身属性的考虑。它们虽然能够从数学上很好地描述具有固定变化的数据集,从而取得很高的识别精度,却不能解决现实复杂环境下的人脸识别问题。为了从根本上提高技术水平,使得算法能够应对现实环境的复杂性和不可预测性,本文引入了两个人脸识别的新思路。第一,从人脸类别在特征空间中的类别分布特点出发,利用人脸类别分布的先验知识,设计适应人脸自身属性的新特征提取算法;第二,引入心理学、神经科学等跨学科知识,利用多层次的仿生手段,设计生物启发式人脸特征提取算法。以这两种思路为指导,面向现实环境下的高精度人脸识别需求,本文主要进行了如下研究:(1)从全局散度分析、局部重叠分析、流形结构分析和分类错误四个角度出发,利用实验手段探索了人脸图像空间中的类别分布特性。各个类别的人脸图像在测量空间中呈现出相似的结构,而且高度重叠。基于人脸类别结构的特殊性,提出人脸空间类别分布的两个先验假设:第一,每类的协方差矩阵相等,同时类内散度远大于类间散度,使得每类的协方差矩阵都近似等于全局的协方差矩阵。第二,不同人之间的类间散度存在于同一子空间中,而且该类间子空间的主方向与类内散度的子空间主方向是不“冲突”的。这两个先验知识使得算法可以不用局限于特定人的训练集合,转而采用大规模的通用数据库对人脸识别中的特征抽取模型进行训练。在FERET数据库上的大规模实验证明,在基于类别结构先验知识的通用学习框架下,采用经典线性鉴别分析方法就可以获得大大超过国际评测最好结果的精度。(2)通过对当前特征抽取算法的深入分析,提出了一个基于投影寻踪技术的算法框架,统一了主成分分析、独立成分分析、线性鉴别分析、局部保持投影、非监督鉴别投影等主流的特征抽取算法,给出了人脸识别中的特征抽取问题的一种新颖的综合性表述。在投影寻踪框架中,算法首先通过白化变换对数据进行预处理,随后利用优化技术寻找具有最优投影特性的低维投影向量。基于投影寻踪框架的实验验证了当前的非监督特征抽取算法都不能很好地寻找低维特征投影,它们在人脸识别中的高性能主要来源于白化过程对人脸类别结构的变换,而并非以往研究中声称的低维投影。为了充分利用人脸类别结构的先验知识,本文提出了一个局部寻踪算法,在白化空间内最大限度地保持样本的局部邻近特性。在AR和FERET数据库上的实验表明局部寻踪算法的非监督和监督版本、线性和核版本都能获得高于当前同类算法的精度。(3)从“样本均匀化”的几何直觉出发,提出了局部离散寻踪算法,解决单训练样本条件下的人脸识别难题。该算法的目标是使得在特征空间中靠近的类别变得分散,降低类间样本混淆的风险,从而提高识别精度。局部寻踪算法引入了两种样本均匀化的新方法:第一,基于奇异值分解的新白化变换理论—该变换可以在小样本情况下把训练样本集变换成一个规范正交集,使得样本间距完全均匀。第二,局部离散投影—对主成分分析进行局部化改造,可以在降低数据维数的同时使得原来局部聚集的样本变得稀疏。该算法的核版本能够进一步提高算法对非线性结构的学习能力,在使用更小量的特征的情况下获得同等精度。在包含1196人的大规模FERET数据库上,局部离散寻踪算法仅采用每人单样本的训练就可以获得远远高于FERET’97评测最好结果的精度水平。为了进一步提高精度水平,本文还提出了融合通用特征模型和特定人特征模型的人脸识别新方法,在FERET评测的duplicate测试图像集中的识别精度超过90%,为该测试集至今发表的最高识别精度。(4)从心理学、神经科学与模式识别的交叉性出发,提出一种多层次的生物启发特征提取方法。该方法包含三个层次。第一,在低层特征生成阶段,采用了一组源于视觉通路早期阶段响应特性的生物启发式特征来表示人类图像。这些特征针对多方面的视觉特性,涵盖了空间局部性、空间频率选择性、边缘方向选择性、色度选择性等。第二,从低层特征到高层特征的映射采用了一个增量式的鲁棒鉴别分析模型。首先使用增量式主成分分析方法把高维低层特征映射为通用的中层特征,再使用鲁棒鉴别分析模型映射为专用于身份识别的高层特征。第三,对不同的人脸特征进行独立的编码,形成独立的视觉通路。最后的识别决策融合了不同的视觉通路得到的多个人脸编码的相似度。生物启发式人脸识别系统模拟了复杂的人类信息融合策略,有效地整合各种信息源获得稳定的人脸识别性能。FRGC版本2实验4中,生物启发式系统获得了超过93%的验证率,不仅超过了FRGC2005评测的最好性能,而且为目前在该标准实验中发表的最高识别精度。