论文部分内容阅读
人脸识别技术应用于手机、平板电脑等移动智能终端的现象越来越普遍。然而通过打印照片、重播视频以及制作掩膜等方式能够伪造人脸绕过移动智能终端的识别机制,从而对其身份识别系统造成极大的威胁。因此,如何检测虚假人脸是目前移动智能终端人脸防伪技术的研究热点。传统的人脸防伪技术以人工设计特征(Hand-crafted Features)作为区分人脸真伪的依据,由于加入了过多的人为限制,通常适用于防范打印照片攻击的模型难以用于抵御重播视频攻击,存在着对于不同种类攻击通用性差的问题。为了提高算法的通用性,将深度学习引入人脸防伪领域。然而,现有的基于深度学习的模型存在三大问题:一是,对于人脸姿态、表情和光照条件变化的适应性差;二是,缺乏明确的监督信息,模型学习到的并不是区分人脸真伪的关键特征,导致检测的准确度不高;三是,对于人脸视频的采集设备和方式等比较敏感,对不同数据集的泛化性差。针对上述问题,本文提出了一种静态特征和动态特征相融合的人脸真伪检测方案。主要工作和创新点如下:1.本文所提的静态特征和动态特征相融合的人脸真伪检测方案首先通过移动智能终端的摄像头采集人脸视频,然后对连续帧进行采样;提取其中第一帧人脸的深度图作为静态特征;再引入光流引导特征,通过分析采样后所有帧中人脸的动态变化得到动态特征;最后将两者融合并以此作为依据区分人脸的真伪。该方案通过设置融合系数λ,控制静态特征和动态特征的相对重要程度,综合了静态特征和动态特征各自的优势,使得融合特征同时具有较强的通用性、适应性和泛化性。2.针对现有算法对不同人脸姿态、表情和光照条件适应性差以及检测准确度不高的问题,本文提出了一种基于3D点云图和深度图的人脸静态特征提取方法,先重建3D点云图,再基于此提取人脸深度图。为了增强对于不同人脸姿态、表情和光照条件的适应性,该方法采用PRNet算法,通过设置专门的UV空间映射,重建图像中人脸的3D点云图。为了提取对于真伪人脸区分度高的特征,进而提高检测的准确度,该方法将3D点云图归一化,以此作为真实标记指导深度网络模型进行训练,引入了明确的监督信息,提取人脸的深度图作为静态特征。3.针对现有算法对不同数据集泛化性差的问题,本文提出了一种基于时序关系和注意力机制的人脸动态特征提取方法。该方法采用光流引导特征(Optical Flow Guided Features)表示连续帧中人脸的短期动态变化,采用CGRU模块对短期动态变化进行积累得到长期动态变化,使得在获得连续帧时序关系的同时,又保留了人脸的空间信息;同时采用注意力机制根据重要程度对不同时间点的视频帧加权组合得到人脸的动态特征,对不同数据集具有较强的泛化性能。4.为了验证本文所提方案的有效性,本文利用CASIA-MFSD、Replay-Attack和SiW三个数据集进行了数据集内部测试和数据集交叉测试,并且对单一特征和融合特征的效果进行了对比。实验结果表明,基于静态特征或动态特征的人脸真伪检测的错误率都不同程度地低于现有算法的错误率;静态特征在数据集内部测试时表现较好,动态特征在数据集交叉测试时表现较好;而融合特征相较于单一的静态特征或动态特征错误率更低,其在数据集内部测试的平均分类错误率最低为(0.18±0.23)%,在数据集交叉测试的半错误率最低为17.0%,能够更好地用于区分人脸真伪。