论文部分内容阅读
人脸是每个人最直接的一种外在表示,也是最自然的一种生物特征。人脸识别就是利用人的脸部特征信息对个体进行身份识别认证的生物识别技术。随着科技文明的发展,人脸识别技术被运用到了生活中的方方面面,给人类世界带来了极大的便利。而人证识别就是人脸识别中的一个具体应用,是使用自然拍摄的图片与系统注册的证件照进行比对的识别技术;它与正常的人脸识别有着相同之处,又有着细微的差别。在人脸识别的过程中,往往伴随着人脸属性分析,即通过算法分析得到该人脸的相应属性,比如,性别,年龄,表情等;这些属性有助于我们在实际场景中做进一步的判断和应用。近些年来,深度卷积神经网络在计算机视觉领域被广泛应用,极大地提高了分类问题的准确率。研究者们主要围绕着如何搭建更深的模型,获取更多的数据、设计更好的优化函数展开研究,从而得到更具表达性的深度特征。在卷积神经网络中,我们通常采用Softmax损失函数来监督网络的训练过程,最后将Softmax损失函数的前一层网络输出结果作为特征进行使用。为了让网络学习到更有区分度的人脸特征,本文围绕网络结构的设计、损失函数的优化、多任务学习等方面进行探索,主要研究内容如下:首先,本文对Softmax损失函数进行解析,探索其可能的改进方法;主要从特征之间的夹角余弦值以及特征的模长度进行优化,这些方法并不改变原本Softmax损失函数优化的本质,仍然能够采用随机梯度下降法对网络进行优化求解。我们以手写数字识别为例,将网络输出的特征可视化,对比了不同参数对结果的影响。最后我们选取了CASIA-WebFace数据库作为人脸分类器的训练数据,结合主流网络结构的设计思想,搭建了28层的卷积神经网络,将上述Softmax损失函数的优化方法应用到人脸分类器的训练过程中,并在LFW数据库上进行了对比测试。实验表明,我们的改进方法相比原始的Softmax损失函数对结果有很大的提升,单个模型就能够在LFW上获得较好的准确率。然后,经上述方法训练的人脸识别模型在人证测试数据库上并不能得到满意的准确率,所以我们对人证识别算法做了进一步的研究。我们收集了一批人证训练数据,其中大部分人只有一张证件照,一张生活照。由于人证数据天然地成对出现,我们修改了经典的度量学习方法Contrastive loss和Triplet loss分别对网络进行训练,同时,结合人证识别的特点,提出了基于样本对相似度分布的Fisher loss,使得正样本对的相似度分布尽可能远离负样本对的相似度分布,从而提高训练得到的特征的区分度。实验表明,我们的方法能够有效地提高网络在人证测试集上的准确率。最后,在人脸属性分析方面,我们采用了多任务学习的方法,将人脸识别与性别识别、年龄识别、表情识别相结合。通过共享前面的卷积层,让网络学习到更加通用的滤波器;另外,将多个不同类型的数据库同时进行训练,能够减小网络的过拟合程度。实验表明,多任务学习能够对人脸属性分析任务起到促进作用,而单任务的人脸属性分析忽视了不同任务之间的共性和联系。