论文部分内容阅读
随着深度学习的飞速发展,计算机视觉领域的技术也越来越多的被应用到人们的日常生活中。人脸识别作为计算机视觉领域的一个分支,在深度学习快速发展的同时,基于深度学习方法实现的人脸识别技术也取得了很大的成就。现有的公开数据集中的人脸图像大多是单一姿态(正脸)的人脸,而在实际应用中,需要进行识别的人脸图像可能是多姿态的,单一姿态数据集在多姿态识别任务中无法取得较好的效果,针对这一问题,本文选取800名志愿者,建立了一个多姿态数据集。该数据集包含800人共4000张图像,每个人采集5种姿态(正脸、左侧脸、右侧脸、低头、抬头),采集时每个人所在场景各不一样,所有人也都处于不同的年龄阶层,采集到的人脸图像相对于摄像头的距离也不一样。本文使用的人脸检测算法为多任务级联卷积神经网络(Multi-task Cascaded Convolutional Networks,MTCNN)算法,其网络结构由三个级联的卷积神经网络PNet、RNet、ONet组成。输入图像尺寸越大,图像金字塔的层数越高,从而导致PNet越耗时,本文通过动态调节最小人脸参数固定图像金字塔层数,不论输入图像尺寸大小是多少,图像金字塔都固定为8层。此外,输入图像中人脸数目越多,RNet和ONet越耗时。本文使用depthwise convolution和channel shuffle操作替换原始MTCNN网络的标准卷积优化第二个问题。由于移动端算力不足、计算资源有限,大型深度学习模型无法在其上顺利应用。针对这一问题,本文提出了一个高效的轻量级网络。在训练时,为了提高多姿态数据集对整个特征提取网络的贡献,修改了样本选取方式。在识别时,为了提高多姿态任务中人脸识别的精度,根据人脸关键点判断当前人脸姿态,然后将当前人脸特征与人脸特征数据库中相应姿态的所有特征进行比对,得出人脸匹配结果。实验结果表明,本文提出的轻量级网络在LFW数据集上精度为99.34%,一整套人脸识别流程在处理器为Qualcomm Snapdragon 820的手机上前向推导时间为49ms,接近实时。同时,使用本文提出的多姿态数据集和多姿态识别方法对识别精度也有提高。