论文部分内容阅读
引言
人脸识别技术广泛应用于对安全性有高要求的人员身份鉴定场景,随着人脸识别技术的日趋成熟,商业化应用愈加广泛,然而极易用照片、视频以及立体面具等方式进行复制[1],若不法分子利用传统人脸识别技术的这个安全性隐患,使用假体人脸成功冒用合法用户身份,从短期来看,侵犯了合法用户的权益,较大可能造成生命财产损失;从长远来看,亦会影响人脸识别技术的进一步广泛深入应用。因此,人脸活体检测技术应运而生,其是指辨别当前获取的人脸图像是来自活体人脸还是假体人脸的过程,以此来达到区分活体人脸和假体人脸的目的,其中活体人脸指有生命的真实人脸,假体人脸指冒充真人身份的人脸仿冒品[2]。如今,随着人脸识别技术的广泛应用,人脸活体检测作为保障人脸识别技术安全性的关键环节,逐渐成为计算机视觉、模式识别、人脸识别领域非常活跃的研究方向。
1.人脸活体检测技术概述
人脸识别起源于1960年-1970年后期,我国的相关技术始于1980年左右,直到1990年,才出现了真正的机器识别,Kohonen、Kirby等[3]提出了基于特征的识别方法,实现了机器识别。随着人脸识别技术逐渐成为研究学者们偏爱的热门课题,至今数千篇论文已经在国际上发表,取得了令人瞩目的结果,也广泛地应用于各个领域。
非法分子在传感器面前进行攻击时主要通过三个途径,分别是非法照片、非法视频、三维立体模型。但是非法照片相对来讲比较容易被识别出来,照片和真人的最大差别就是照片是静态的,而真实的人是动态的。非法视频可以从现有的合法用户的视频中获取,在使用高清设备录制视频时,视频图像清晰且可以和真实活体人脸一样,能够眨动眼睛等五官发生变化,所以人脸识别面临的视频攻击对活体检测系统有着更大的威胁。三维立体人脸模型可以利用人脸部位的不同角度的图像信息或视频信息合成,Pighin等就曾经利用人脸照片合成了具有不同人脸表情的三维立体人脸模型;Blanz 等人曾经通过一张包含人脸图像的照片合成了具有人脸纹理信息的三維立体模型,提出了Morphable 3D Face Model;Z.Liu等人从包含面部图像的视频中建立与真实五官极其相近的三维人脸模型。面临着人脸识别系统被多种方式攻击的严峻挑战,学者们对活体检测系统开始了细致的探索,提出了多种解决方案。
2. 人脸活体检测技术分解
现有的人脸活体检测方法从多种不同的角度致力于将活体人脸图像与假体人脸图像区分开来,关于人脸活体检测方法的分类,根据不同的分类依据可以得到不同的分类体系。人脸活体检测方法一般将人脸活体检测问题作为一个活体人脸图像和假体人脸图像的二分类问题来处理。分类问题的性能很大程度上由算法是否使用了区分性足够强的特征以及是否使用了合适的分类策略。
考虑到特征的重要性,本文拟以人脸活体检测方法所利用的特征种类为线索将当前的人脸活体检测方法分为两个技术分支:一是交互式人脸活体检测;二是非交互式人脸活体。
2.1交互式人脸活体检测
交互式人脸活体检测利用动作指令与用户交互,系统通过判断用户是否准确完成了指定动作来辨别摄像头前的人脸是活体人脸还是假体人脸。在交互式人脸活体检测技术分支,可以根据检测的目标内容,将检测方法分为基于脸部动作以及基于声音两个二级分支。
(a)脸部动作检测:基于随机动作指令的交互式人脸活体检测中,常见的随机动作指令有点头、抬头、眨眼、闭眼、遮挡眼睛、扬眉、皱眉、笑脸、吐舌头、张嘴等,在此过程中涉及到利用相关算法对用户面部动作的识别,以对用户的动作进行匹配,以判断当前人脸是否为活体。比如,指导用户完成随机表情动作,通过计算多帧图像的SIFT流能量值来判断用户是否完成了指定表情。
(b)朗读检测:基于随机动作指令的交互式人脸活体检测中,常见的随机动作指令除去上述脸部动作外,还包括让用户朗读一段文字,通过获取用户的声音,对用户的发声来判断当前人脸是否为活体。比如通过检测人脸嘴部区域的变化幅度进行唇语识别,辅以语音识别获取用户响应的语音信息共同判断用户是否按要求朗读了系统随机给出的语句。
2.2非交互式人脸活体检测
在非交互式人脸活体检测技术分支,可以根据所利用的特征种类,将检测方法分为基于图像质量、基于图像纹理特征、基于生命信息特征以及基于热红成像特征四个二级分支。
(a)基于图像质量:假体人脸的呈现需要一定的媒介,不管是照片纸、打印纸、电子设备、硅胶、塑料等各类媒介的材料属性与活体人脸的五官、皮肤材质都有差异。材质的差异会导致反射属性的差异,比如照片纸、手机显示屏会有一些镜面反射而活体人脸基本不会存在这种现象。基于图像质量的方法主要利用图像失真、反射属性方面的差异分辨真假人脸。
(b)基于图像纹理特征:活体人脸有复杂的三维立体结构,照片、视频类攻击是二维的平面结构,光在三维结构和二维结构表面不同的反射会形成脸部颜色明暗区域的差异。基于纹理的方法主要利用这些差异为线索进行活体人脸和假体人脸的分类,比如,通过LBP、HOG、Gabor 等描述符从灰度图中抽取的灰度纹理特征,再利用支持向量机完成分类,检测出图像是否来自实际活体用户。总体来说,基于纹理的方法计算量少,计算复杂度低,容易实现,但是该方法着重利用纹理颜色方面的差异进行分类,要求输入图像的分辨率高,对采集设备有高要求。
(c)基于生命信息特征:活体人脸和假体人脸之间一个明显的区别是活体有心跳、血液流动、眨眼、脸部肌肉不自主的微运动等生命特征,而大部分类别的假体人脸难以完美模仿此类生命特征。主要有光流法、运动成分分解检测活体不自主的眨眼,脸部、唇部的微运动,以及远程光学体积描记术(rPPG) 信息检测待测对象是否具有心率等,来检测人脸是否来自活体。此类方法对照片类假体人脸的识别准确率高,但是需要视频为输入,计算量大,速度慢,难以防范视频攻击,并且对假体制造的微运动鲁棒性不够强。
(d)基于热红成像特征:假体人脸的材质与活体人脸的皮肤、眼睛、嘴唇、眉毛等部位的材质不同,而材质的不同就会造成反射属性有差异。不同于可见光条件下呈现出来的图像,其实能反应人脸热辐射状态的热红图像本身就表明了被检测的人为真实活体,具有准确率高的特点。目前,基于热红成像的面向人脸识别的活体检测还处于试验阶段,没有大量的数据样本测试它的性能,热红外不会受到光照的影响,但是受温度的影响较大,而且酒精、玻璃遮挡也会影响热红成像的结果,并且需要额外的昂贵设备支持。
3. 结语
本文对人脸活体检测技术领域进行分析和整理,以交互式人脸活体检测和非交互式人脸活体检测为主线。经过对该技术领域的梳理,有助于全面了解人脸活体检测技术领域的基本发展态势,对涉及人脸活体检测技术领域的发展创新有一定帮助。
参考文献:
[1] Li Y, Xu K, Yan Q, Li Y J, Deng R H. Understanding osn-based facial disclosure against face authentication systems. In: Proceedings of the 9th ACM Symposium on Information, Computer and Communications Security. Kyoto, Japan: ACM, 2014. 413-424.
[2] Ministry of Public Security of the People's Republic of China. Ga/T1212-2014 Face recognition application in security systems-testing methodologies for anti-spooing,2014.
[3]徐琼, 干宗良, 刘峰, 陈昌红. 基于提升树的自然场景中文文本定位算法研究[J].南京邮电大学学报(自然科学版), 2013, 06:76-82.
人脸识别技术广泛应用于对安全性有高要求的人员身份鉴定场景,随着人脸识别技术的日趋成熟,商业化应用愈加广泛,然而极易用照片、视频以及立体面具等方式进行复制[1],若不法分子利用传统人脸识别技术的这个安全性隐患,使用假体人脸成功冒用合法用户身份,从短期来看,侵犯了合法用户的权益,较大可能造成生命财产损失;从长远来看,亦会影响人脸识别技术的进一步广泛深入应用。因此,人脸活体检测技术应运而生,其是指辨别当前获取的人脸图像是来自活体人脸还是假体人脸的过程,以此来达到区分活体人脸和假体人脸的目的,其中活体人脸指有生命的真实人脸,假体人脸指冒充真人身份的人脸仿冒品[2]。如今,随着人脸识别技术的广泛应用,人脸活体检测作为保障人脸识别技术安全性的关键环节,逐渐成为计算机视觉、模式识别、人脸识别领域非常活跃的研究方向。
1.人脸活体检测技术概述
人脸识别起源于1960年-1970年后期,我国的相关技术始于1980年左右,直到1990年,才出现了真正的机器识别,Kohonen、Kirby等[3]提出了基于特征的识别方法,实现了机器识别。随着人脸识别技术逐渐成为研究学者们偏爱的热门课题,至今数千篇论文已经在国际上发表,取得了令人瞩目的结果,也广泛地应用于各个领域。
非法分子在传感器面前进行攻击时主要通过三个途径,分别是非法照片、非法视频、三维立体模型。但是非法照片相对来讲比较容易被识别出来,照片和真人的最大差别就是照片是静态的,而真实的人是动态的。非法视频可以从现有的合法用户的视频中获取,在使用高清设备录制视频时,视频图像清晰且可以和真实活体人脸一样,能够眨动眼睛等五官发生变化,所以人脸识别面临的视频攻击对活体检测系统有着更大的威胁。三维立体人脸模型可以利用人脸部位的不同角度的图像信息或视频信息合成,Pighin等就曾经利用人脸照片合成了具有不同人脸表情的三维立体人脸模型;Blanz 等人曾经通过一张包含人脸图像的照片合成了具有人脸纹理信息的三維立体模型,提出了Morphable 3D Face Model;Z.Liu等人从包含面部图像的视频中建立与真实五官极其相近的三维人脸模型。面临着人脸识别系统被多种方式攻击的严峻挑战,学者们对活体检测系统开始了细致的探索,提出了多种解决方案。
2. 人脸活体检测技术分解
现有的人脸活体检测方法从多种不同的角度致力于将活体人脸图像与假体人脸图像区分开来,关于人脸活体检测方法的分类,根据不同的分类依据可以得到不同的分类体系。人脸活体检测方法一般将人脸活体检测问题作为一个活体人脸图像和假体人脸图像的二分类问题来处理。分类问题的性能很大程度上由算法是否使用了区分性足够强的特征以及是否使用了合适的分类策略。
考虑到特征的重要性,本文拟以人脸活体检测方法所利用的特征种类为线索将当前的人脸活体检测方法分为两个技术分支:一是交互式人脸活体检测;二是非交互式人脸活体。
2.1交互式人脸活体检测
交互式人脸活体检测利用动作指令与用户交互,系统通过判断用户是否准确完成了指定动作来辨别摄像头前的人脸是活体人脸还是假体人脸。在交互式人脸活体检测技术分支,可以根据检测的目标内容,将检测方法分为基于脸部动作以及基于声音两个二级分支。
(a)脸部动作检测:基于随机动作指令的交互式人脸活体检测中,常见的随机动作指令有点头、抬头、眨眼、闭眼、遮挡眼睛、扬眉、皱眉、笑脸、吐舌头、张嘴等,在此过程中涉及到利用相关算法对用户面部动作的识别,以对用户的动作进行匹配,以判断当前人脸是否为活体。比如,指导用户完成随机表情动作,通过计算多帧图像的SIFT流能量值来判断用户是否完成了指定表情。
(b)朗读检测:基于随机动作指令的交互式人脸活体检测中,常见的随机动作指令除去上述脸部动作外,还包括让用户朗读一段文字,通过获取用户的声音,对用户的发声来判断当前人脸是否为活体。比如通过检测人脸嘴部区域的变化幅度进行唇语识别,辅以语音识别获取用户响应的语音信息共同判断用户是否按要求朗读了系统随机给出的语句。
2.2非交互式人脸活体检测
在非交互式人脸活体检测技术分支,可以根据所利用的特征种类,将检测方法分为基于图像质量、基于图像纹理特征、基于生命信息特征以及基于热红成像特征四个二级分支。
(a)基于图像质量:假体人脸的呈现需要一定的媒介,不管是照片纸、打印纸、电子设备、硅胶、塑料等各类媒介的材料属性与活体人脸的五官、皮肤材质都有差异。材质的差异会导致反射属性的差异,比如照片纸、手机显示屏会有一些镜面反射而活体人脸基本不会存在这种现象。基于图像质量的方法主要利用图像失真、反射属性方面的差异分辨真假人脸。
(b)基于图像纹理特征:活体人脸有复杂的三维立体结构,照片、视频类攻击是二维的平面结构,光在三维结构和二维结构表面不同的反射会形成脸部颜色明暗区域的差异。基于纹理的方法主要利用这些差异为线索进行活体人脸和假体人脸的分类,比如,通过LBP、HOG、Gabor 等描述符从灰度图中抽取的灰度纹理特征,再利用支持向量机完成分类,检测出图像是否来自实际活体用户。总体来说,基于纹理的方法计算量少,计算复杂度低,容易实现,但是该方法着重利用纹理颜色方面的差异进行分类,要求输入图像的分辨率高,对采集设备有高要求。
(c)基于生命信息特征:活体人脸和假体人脸之间一个明显的区别是活体有心跳、血液流动、眨眼、脸部肌肉不自主的微运动等生命特征,而大部分类别的假体人脸难以完美模仿此类生命特征。主要有光流法、运动成分分解检测活体不自主的眨眼,脸部、唇部的微运动,以及远程光学体积描记术(rPPG) 信息检测待测对象是否具有心率等,来检测人脸是否来自活体。此类方法对照片类假体人脸的识别准确率高,但是需要视频为输入,计算量大,速度慢,难以防范视频攻击,并且对假体制造的微运动鲁棒性不够强。
(d)基于热红成像特征:假体人脸的材质与活体人脸的皮肤、眼睛、嘴唇、眉毛等部位的材质不同,而材质的不同就会造成反射属性有差异。不同于可见光条件下呈现出来的图像,其实能反应人脸热辐射状态的热红图像本身就表明了被检测的人为真实活体,具有准确率高的特点。目前,基于热红成像的面向人脸识别的活体检测还处于试验阶段,没有大量的数据样本测试它的性能,热红外不会受到光照的影响,但是受温度的影响较大,而且酒精、玻璃遮挡也会影响热红成像的结果,并且需要额外的昂贵设备支持。
3. 结语
本文对人脸活体检测技术领域进行分析和整理,以交互式人脸活体检测和非交互式人脸活体检测为主线。经过对该技术领域的梳理,有助于全面了解人脸活体检测技术领域的基本发展态势,对涉及人脸活体检测技术领域的发展创新有一定帮助。
参考文献:
[1] Li Y, Xu K, Yan Q, Li Y J, Deng R H. Understanding osn-based facial disclosure against face authentication systems. In: Proceedings of the 9th ACM Symposium on Information, Computer and Communications Security. Kyoto, Japan: ACM, 2014. 413-424.
[2] Ministry of Public Security of the People's Republic of China. Ga/T1212-2014 Face recognition application in security systems-testing methodologies for anti-spooing,2014.
[3]徐琼, 干宗良, 刘峰, 陈昌红. 基于提升树的自然场景中文文本定位算法研究[J].南京邮电大学学报(自然科学版), 2013, 06:76-82.