论文部分内容阅读
随着计算机软硬件技术的突飞猛进以及计算机视觉技术的快速发展,人机交互与人脸识别技术,越来越受到国内AI学者的关注。其中人脸姿态估计是人机交互的重要组成部分,而人脸对齐是人脸识别的必要预处理过程。近几年,在深度学习的推动下,对于这两个方向的研究都有了突破性的进展。然而在自然光照的非约束场景下,人脸图像受到各种因素的影响,仍然存在很多难题和瓶颈。在这其中,人脸姿态估计作为不可忽视的影响因素在很大程度上干扰了人脸对齐的精确率。为了有效的解决这一问题,本文在深入学习和研究现今流行的大姿态人脸对齐算法的基础上,提出了一种基于Pytorch深度学习框架的沙漏网络模型。算法有效地降低了姿态因素对人脸对齐的影响,提高了人脸对齐精确度,并在此基础上探索了基于人脸对齐的大姿态估计等问题。本文的主要贡献如下:1.总结并阐述了当前人脸对齐及姿态估计主要面临的挑战和研究现状。详细的介绍了这两类问题中具有代表性的算法流程,并对这些算法的性能及优缺点进行了分析。2.在深入了解和研究现今流行的人脸对齐方法的基础上,本文提出了一种基于Inception-Resnet模块的沙漏网络模型算法。该算法使用端到端的卷积神经网络模型,规避了以往方法需要分阶段处理训练目标而带来的偏差影响。本文方法通过结合1*1卷积核、3*3卷积核以及跳跃连接,构成了Inception-Resnet模块,再由Inception-Resnet模块组成一阶沙漏模型,四个一阶沙漏模型串联最终构成本文的四阶沙漏网络模型。实验结果表明,本文所提出的算法在大姿态人脸图片上的归一化均方误差降为5.92%,较现有方法降低了12.7%,各姿态整体的归一化均方误差降为4.41%,较现有方法降低了8.9%,较好地实现了自然环境下各种姿态的人脸对齐。3.结合本文人脸对齐算法获取的人脸特征点,提出一种新的基于特征点的人脸姿态估计算法。采用基于抗差估计的非线性最小二乘法进行人脸姿态估计,实验结果表明,当人脸偏转角度值在(0°,30°)时,本文算法的平均绝对误差为1.09°。当人脸角度在(30°,90°)时,本文算法仍保持在3°以内的高精度估计,较传统非线性最小二乘法法提升了约50%的精度。在此基础上,使用本文姿态估计算法结合并行深度估计网络,得到了较好的人脸深度估计结果。