基于沙漏网络模型的大姿态人脸对齐与人脸估计

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:xxxxssss11112222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软硬件技术的突飞猛进以及计算机视觉技术的快速发展,人机交互与人脸识别技术,越来越受到国内AI学者的关注。其中人脸姿态估计是人机交互的重要组成部分,而人脸对齐是人脸识别的必要预处理过程。近几年,在深度学习的推动下,对于这两个方向的研究都有了突破性的进展。然而在自然光照的非约束场景下,人脸图像受到各种因素的影响,仍然存在很多难题和瓶颈。在这其中,人脸姿态估计作为不可忽视的影响因素在很大程度上干扰了人脸对齐的精确率。为了有效的解决这一问题,本文在深入学习和研究现今流行的大姿态人脸对齐算法的基础上,提出了一种基于Pytorch深度学习框架的沙漏网络模型。算法有效地降低了姿态因素对人脸对齐的影响,提高了人脸对齐精确度,并在此基础上探索了基于人脸对齐的大姿态估计等问题。本文的主要贡献如下:1.总结并阐述了当前人脸对齐及姿态估计主要面临的挑战和研究现状。详细的介绍了这两类问题中具有代表性的算法流程,并对这些算法的性能及优缺点进行了分析。2.在深入了解和研究现今流行的人脸对齐方法的基础上,本文提出了一种基于Inception-Resnet模块的沙漏网络模型算法。该算法使用端到端的卷积神经网络模型,规避了以往方法需要分阶段处理训练目标而带来的偏差影响。本文方法通过结合1*1卷积核、3*3卷积核以及跳跃连接,构成了Inception-Resnet模块,再由Inception-Resnet模块组成一阶沙漏模型,四个一阶沙漏模型串联最终构成本文的四阶沙漏网络模型。实验结果表明,本文所提出的算法在大姿态人脸图片上的归一化均方误差降为5.92%,较现有方法降低了12.7%,各姿态整体的归一化均方误差降为4.41%,较现有方法降低了8.9%,较好地实现了自然环境下各种姿态的人脸对齐。3.结合本文人脸对齐算法获取的人脸特征点,提出一种新的基于特征点的人脸姿态估计算法。采用基于抗差估计的非线性最小二乘法进行人脸姿态估计,实验结果表明,当人脸偏转角度值在(0°,30°)时,本文算法的平均绝对误差为1.09°。当人脸角度在(30°,90°)时,本文算法仍保持在3°以内的高精度估计,较传统非线性最小二乘法法提升了约50%的精度。在此基础上,使用本文姿态估计算法结合并行深度估计网络,得到了较好的人脸深度估计结果。
其他文献
在如今经济全球化的时代,翻译服务的重要性逐渐体现。相较于人工翻译服务而言,机器翻译的速度更快,更能满足社会的需求。神经机器翻译作为一种利用大规模双语平行语料对神经
知识经济时代的到来,知识逐渐取代了劳动、资本以及自然资源,现如今已成为了企业内十分紧要的资源之一,知识管理这一过程包括知识的产生、转移以及运用,对于企业而言都是保持
随着传统能源的日渐枯竭以及人们环保意识的日益加强,清洁、环保的可再生能源逐渐受到世界各国的广泛关注。风能是可再生能源中最具商业化的资源形式。由于海洋风能具有风速
传统村落见证了中国的千年历史,承载着古老的农耕文化,孕育出不同的村落形态,是我国历史文明发展的教科书。随着“新农村建设、城镇化、旅游民俗”等新政策与新形式的发展,传
[实验目的]本课题拟在大鼠骨髓间充质干细胞(BMSCs)与大鼠小肠隐窝上皮细胞(IEC-6)联合培养的过程中观察是否BMSCs能分化为肠上皮样细胞;加入PI3K阻断剂后测定BMSCs中CK、Vil
2007年,中国人民银行推出了上海银行间同业拆放利率Shibor,迈出了我国利率市场化改革的关键一步。本文从我国双轨制利率体系特点及Shibor推出的背景入手,对Shibor基准利率运行效
我国渔民的就业形式主要是海洋捕捞和海水养殖,但随着近几年自然资源的普遍衰退,海洋渔业资源面临枯竭,产业结构迎来了一个巨大的转变,渔民纷纷转产转业,海洋及渔场污染的日益严重
本文总结了神经内科护理教学中实施Seminar教学法、学习迁移理论教学、循证医学教学法的意义,并将三种教学法在神经内科护理教学中的应用效果进行了阐述,认为综合教学法有助