论文部分内容阅读
伴随生物信息科学在近些年来的飞速发展,生物特征识别技术迅速融入到当今人类社会活动的方方面面。当今常用的生物信息包括,掌纹、指纹、虹膜、人脸、步态等。其中,人脸信息具有自然性、不易察觉性等独特的特性,使其更加适用于隐蔽侦查、公共安防等领域。随着硬件水平的发展、计算能力的提升,数据规模、学习算法和特征提取模型逐渐成为人脸识别任务,乃至整个模式识别领域的重要影响因素。而当前面向人脸识别的深度学习技术中,在上面三个方面依然有1)数据规模过小、多样性不足;2)学习算法没有对训练数据进行优化;3)提取深度特征对前期人脸图像预处理步骤敏感等问题。针对上述问题,本文主要从大规模数据集的创建、针对特定数据集更有效的学习算法、提取用于验证的更加稳定的特征三个角度出发,对人脸识别算法进行改进。本文的主要工作如下:(1)针对现有公开数据集多样性和丰富性不满足日益苛刻的精度要求这个矛盾,提出了一个大规模人脸数据集及其复杂样本构建方法。本文提出了一个融合了三个公开数据集与三个商用数据集的更大的人脸数据集PDLFace,该数据集在人种、肤色、光照、配饰、姿态等方面都有很强的多样性。进而提出了一种样本上采样方法IUSM,该方法有效提高了偏移特征空间中的人脸验证性能,并没有影响模型在全特征空间中的泛化性能。(2)针对目前学习算法未对训练数据集进行专有优化,导致模型易受训练数据中脏样本影响的问题,本文提出了一种基于深度学习框架的更加鲁棒人脸识别学习算法Soft-Triplets。文中在分析了传统三元组选择策略的局限后,提出了一种基于三元组损失层的新颖的三元组选择策略。该策略通过引入两个可调节变量,即可调节模型对困难样本的拟合能力,又可调节模型对常规样本的泛化能力。通过调校模型中的超参数,该方法可以有效地减轻了数据集中脏样本对模型泛化能力的影响。(3)针对深度人脸特征对前期预处理敏感的问题,提出了一种面向人脸验证的更加鲁棒的监督学习特征线性融合方法。本文提出了一种人脸多滑窗特征线性加权的基于监督训练的融合方法。该方法利用人脸验证任务的二分类特性,通过海量数据的基于Fisher判别标准的监督训练优化,使分别对应两个类别的相似度分布更加分开。本文进一步提出上述问题的迭代优化方法,在训练效率和有效性有一定提高。该方法在实际应用中有稳定性强,融合计算量小,实现简单等优点。