论文部分内容阅读
许多人脸识别模型依赖于训练数据的规模。对实际应用而言,原型集合(gallery)中每个人只有一个样本,如:面部解锁、刷脸支付等。这类问题通常被称作单样本人脸识别(Single Sample Face Recognition,SSFR)问题。人脸识别在单样本的情况下将面临很大挑战:一、每个人的类内散度矩阵退化为0,使得大多数判别分析方法无法工作;二、训练的模型较容易欠拟合,导致其泛化能力较差。因此,如何提高模型的准确率是非常具有挑战!目前,针对SSFR有许多有效的算法被提出。从是否使用gallery的角度,SSFR算法可分为:gallery敏感、gallery不敏感。从使用样本的角度,SSFR算法又分为:无监督学习、生成额外样本、基于辅助数据集的学习方法。这些方法一定程度上较好地处理了SSFR问题,但是仍然存在一些问题。对于无监督方法,其不能利用gallery中监督知识来指导模型学习;对于生成额外样本方法,生成样本的质量难以保证;对于基于辅助数据集的学习方法,当辅助数据与gallery中数据分布差异较大时,gallery中数据的类内变化难以被估计,单源迁移学习方法弥补了这个不足,但实际情形下,会存在多个监督源域,现有方法无法充分利用多个源域的监督知识。针对上述提到SSFR不足,本文开展了两个研究:(1)为了能够充分的利用多个源领域的知识来帮助目标域学习一个更好的模型,我们迁移多个源域的知识到目标领域来学习一个gallery不敏感的模型,并且提出一种多源域自适应单样本人脸识别算法:目标化多个源域(Targetize Multi-source Domain,TMSD)。在Multi-PIE、CAS-PEAL-R1数据集上进行大量实验验证了TMSD有效性。(2)gallery与测试样本密切相关,为了提高模型对测试样本判别能力,我们利用gallery指导模型学习,并提出了基于领域自适应的gallery敏感单样本人脸识别算法:判别领域自适应(Discriminative Domain Adaptation,DDA)。并且复现七个单样本人脸识别算法,在Multi-PIE、CAS-PEAL-R1、OFD、AR、FERET五个数据集进行实验。结果证明DDA在Rank-1标准下准确率优于其他算法。本文工作的创新点如下:1).提出了TMSD,并且给出了详细推导,并且TMSD提供了具体的优化方案;2).提出了一种基于公共子空间的Gallery类内散度矩阵的估计方法;3).对于原始空间中结合目标化源域的类内散度矩阵与在公共子空间中学习到的系数来推断gallery的类内散度矩阵的过程进行详细地证明;4).结合目标化源域的类间散度矩阵、目标域的总体散度矩阵以及gallery的类间散度矩阵、总体散度矩阵,利用判别分析方法学习一个特征提取器