论文部分内容阅读
身份认证在信息时代有着重要的地位,被广泛用于金融、考勤、门禁、安防等众多领域。区别于传统的身份认证技术,利用人体所固有的生物特征或者行为特征等信息进行身份认证对于使用者而言,更为便捷、安全、可靠且难盗取等优点。作为人体固有的诸多生物特征中最为自然和主要的特征,人脸是人类在日常生活中辨别不同人员最主要的依据。由于其易操作、非侵犯性、非接触性、结果直观等优点,人脸识别是生物特征识别领域长久以来的研究热点。近年来,尽管受益于计算机算力的巨大提升、数据的海量增长和深度学习算法的不断创新,人脸识别技术得到了极大的提升并在越来越多的场景进行落地,然而,人脸识远非一个已经解决的问题。一方面,识别准确率的数量级式提升不断地拓展着人脸识别技术应用的边界,推动其在越来越多的应用场景进行落地,而应用边界的不断拓展对人脸识别的精度和规模提出了更高的要求。另一方面,尽管基于深度神经网络的人脸识别相对于其它方法有着巨大的性能优势,巨大的计算开销也是制约其更广泛应用的主要因素。如何在提升准确率的同时降低深度神经网络计算和存储开销,是人脸识别领域非常重要且颇具挑战的问题。本文就如何对人脸识别系统进行轻量化的同时提升识别精度这一问题开展了如下研究工作:(1)提出了一种基于相关一致性约束的知识蒸馏方法(correlation congruence for knowledge distillation,CCKD),来提升轻量化人脸识别网络的精度。CCKD在单样本层面的知识蒸馏基础上,增加了不同样本间的相关一致性约束,让学生网络学习教师网络学到的样本间的相关一致性知识,来提升学生网络的性能。研究了不同相关性度量方法的影响,并提出了基于高斯核函数的泰勒展开来建模相关性的方法。此外,研究了不同的小批量数据采样方法对于相关一致性知识蒸馏的影响。通过在图像分类数据集CIFAR-100和ImageNet-1K、行人重识别MSMT-17数据集和人脸识别测试集MegaFace的实验,验证了 CCKD能有效提升学生网络的性能。(2)提出了一种基于教师网络参数空间内优化路径约束的知识蒸馏方法(knowledge distillationv via route constrained optimization,RCO),来缩小人脸识别轻量化网络和复杂网络之间的性能差距。以往的知识蒸馏方法都只将收敛状态的教师网络作为学生网络的学习目标。受到课程学习启发,RCO利用教师网络参数空间中的优化路径构造了一个从易到难的目标序列,来指导学生网络的训练过程。RCO旨在使得学生网络能更加逼近收敛状态下的教师网络,达到一个更好的局部最优点,来缩小学生网络和教师网络的性能差距。研究了不同目标序列的构造策略,并提出了一种基于贪心策略的课程学习目标序列构造方法,来缩短学生网络的学习时间同时提升其性能。通过在CIFAR-100、ImageNet-1K和MegaFace数据集上的实验,验证了 RCO提升学生网络性能的有效性。(3)提出 了一种选择性知识蒸馏方法(selective knowledege distillation,SKD),来降低轻量化人脸识别网络的学习难度,提升其性能。从教师网络的知识表示形式来看,以往的知识蒸馏主要着眼于探索除logits之外的表示形式,如注意力图[3]、特征表达[4]样本间相关性[5,6]等。这类方法的本质都是将教师网络的所有知识视作完全正确的知识,迫使学生网络对其进行学习。SKD根据学生网络的学习能力来动态选择性地选取教师网络中置信度较高的知识,摒弃置信度较低的知识,显著提升了轻量人脸识别网络的性能。此外,详细介绍了基于SKD方法获得的亚军的ICCV国际会议轻量级人脸识别挑战赛方案。(4)针对基于视频(或模板)的人脸识别系统中低质量图像极大影响系统性能这一问题,提出了一种面向识别的无参考人脸图像质量评价方法用于从多帧图像中选择高质量图像进行识别。该方法将人脸图像质量评价和人脸识别进行关联,无需手工或半手动去选定用参考图像或标注质量分。在此基础上,设计了一种简单而快速的方法来生成大量带有质量标签的数据集。研究了不同网络大小对于人脸图像质量评价性能的影响,并提出了一个高效的极小深度网络(tinyFQnet)。通过在基准测试集IJB-B、IJB-C和YTF的实验,验证了所提出方法的有效性。(5)提出了一种基于特征空间内几何信息的多帧图像特征融合方法(geometry-guided feature aggregation,GFA)。以往对于多帧图像的特征融合方法主要基于每一帧的重要性,忽视了多帧图像在特征空间内的几何关系,可能导致融合后的特征趋向密度大的区域而非更具判别性的分布中心位置。GFA首先将每一帧的几何信息定义为该帧和对应类别的参考图像在特征空间内的余弦距离,通过训练一个深度神经网络来预测每一帧和参考图像的余弦距离。然后,基于该几何信息,GFA将多帧图像特征融合问题转化为一个二次规划问题。通过求解该二次规划问题来获得每一帧图像的权重,并最终根据该权重进行融合,得到更具判别性的融合后的特征。通过IJB-A和YTF数据集的实验,验证了 GFA方法的有效性。