基于深度学习的面部姿态估计与特征点定位的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gongbin1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术和计算机视觉领域的发展,智能的人机交互和精确的人脸识别具有越来越重要的学术价值以及广阔的市场前景。其中面部姿态估计是人机交互的重要组成,而面部特征点定位则是人脸识别的核心。面部姿态估计也叫头部姿态估计,是指根据面部图像定位出头部在空间三个角度参数的过程,而面部特征点定位是根据人脸图像定位出若干个人为定义好的特征点的过程。在深度学习浪潮的推动下,这两个计算机视觉任务都取得了突破性的进展,然而在实际应用中,存在众多干扰因素的影响,导致算法的预测效果下降,因此设计有效的面部姿态估计与特征点定位的算法仍然具有重要的研究意义。本文围绕面部姿态估计与特征点定位这两个问题,通过研究已有方法存在的不足对已有算法提出改进方案,论文主要贡献如下:(1)分析了单模态算法的不足,设计了一种基于多模态的面部姿态估计算法。首先从模型的构建角度入手,在概率性框架下推导出混合模型的目标函数,并介绍了迭代交替的训练方式。在两组公开数据集上,设计了多组对比实验,跟目前经典的算法相比,本文提出的混合回归算法取得了更低的平均绝对误差。最后通过对图像样本增加不同强度的噪声或遮挡,生成了新的噪声数据集,实验结果验证了该混合回归模型对于噪声和遮挡均具有较好的鲁棒性。(2)提出了一种改进的深度特征点定位网络。在原网络的基础上,使用精心设计的多种尺寸的残差模块网络去改进原有的卷积神经网络,使网络具有更强的特征提取能力,改进后的模型在公开的数据集300W上取得了9.1%的提升。分析了改进前后网络的存储开销和运算瓶颈,使用了两种不同的轻量级网络模块在算法层面对模型进行压缩,并通过实验验证了模型压缩的有效性。(3)提出了一种基于半监督学习的面部特征点定位算法。在面部特征点模型的训练中,往往需要大量的标签样本,导致数据获取开销过大。针对这个问题,本文在深度对齐网络的基础上,引入了一种半监督的学习机制,利用大量的无标定的数据和有限的标签样本一起训练模型。该方法将监督学习和无监督学习统一,通过无监督学习来提高监督学习的效果。实验证明,引入的半监督模型学习机制,显著提升了原有模型的特征点定位的准确度。
其他文献
物联网属于一种新型的信息技术产业,发展前景较好,对我国国民经济以及社会发展具有重要影响。茶业物联网在农业领域中的有效利用,促使传统茶叶种植发生了重大的改变。现对茶
目的研究丙酸氟替卡松与孟鲁司特联合治疗变应性鼻炎的效果。方法选取72例变应性鼻炎患者,按照治疗方法分为对照组(36例)与研究组(36例)。对照组选用丙酸氟替卡松治疗,研究组选用
当下众多影视作品中,导演可以运用蒙太奇手法,把时间顺序、地点顺序进行艺术处理,使之更能表现出电影的真正思想与内涵。通过解析蒙太奇手法的合理运用,蒙太奇手法得以实现所
从阳气与营卫循行角度简要剖析了丁元庆教授关于抑郁症"阳气抑遏,神颓志衰"新的病机理论,即指出抑郁症病机的关键在于"阳郁不达,神机颓废",抑郁症患者的绝大多数临床表现概由
<正>201 4年8月31日第十二届全国人大常委会第十次会议通过了《全国人民代表大会常务委员会关于修改〈中华人民共和国预算法〉的决定》(以下简称《决定》),并重新颁布了修改
中国山区农村的男性历来就存在着娶妻难的问题。近年来,伴随着社会的急剧变化,尤其是长期的低生育率和打工经济的兴起,该问题呈现出更加严峻的形势。大量男性失婚给村落的和谐稳定带来了诸多不良影响。鉴于此,笔者对武陵山片区C乡进行了田野调查,探索山区农村男性娶妻难问题的形成机制、应对策略与后果,一方面从理论上揭示当地男性娶妻难问题的内在机理,另一方面也为农村男性娶妻难问题的研究提供借鉴。本研究从婚姻市场理论
对近年来广州新沙港口岸进口大豆(巴西、阿根廷、美国)的品质各项指标(水分、杂质、热损伤、损伤、破碎粒、容重、粗油脂、粗蛋白)进行分析比较,发现2005~2008年广州新沙口岸
随着民主理论的“协商”转向的出现,协商民主理论家围绕公民如何参与民主协商形成了两种具有代表性的协商方式。一种是论证,另一种则是叙事。以哈贝马斯为代表的协商民主理论
文章从当代特有的后现代社会特点入手,分析了图像的生产在当今社会条件下所呈现的便捷快速和易于修改的特点;并且在这一系列的特征所产生的图像创作基础上,分析图像作为社会