基于级联姿态回归的部分遮挡人脸特征点定位研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:blackfairy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人脸识别、表情分析、人脸3D重构等重要任务的基础,人脸特征点定位课题受到了研究者的广泛关注并取得了巨大的进展,其中级联姿态回归算法在受控条件(例如,光照良好、无遮挡、正面人脸)下取得了接近人类水平的特征点定位准确度,然而,当人脸被墨镜、口罩、头发等物体遮挡时,其特征点定位准确度出现大幅度的下降。级联姿态回归算法依赖于良好的初始人脸形状和表示能力强的形状索引特征,遮挡一方面会降低人脸检测的精度进而影响到级联姿态回归算法的初始人脸形状,另一方面会破坏人脸的部分图像特征进而给级联姿态回归算法的形状索引特征带来噪声。针对上述问题,本文从级联姿态回归算法的初始人脸形状和形状索引特征两方面进行研究,提高初始人脸形状的质量并降低遮挡给形状索引特征带来的噪声,最终有效地提高了级联姿态回归算法在遮挡条件下的特征点定位准确度。本文的工作概括如下:(1)针对人脸遮挡导致级联姿态回归算法的初始形状误差较大的问题,提出了一种基于五点估计和纹理相似度的形状初始化方法。为了降低初始形状的误差,本文利用遮挡的局部性质,采用先局部后整体的人脸形状初始化方法,首先基于MTCNN估计出人脸五个关键点(双眼中心、鼻尖和左右嘴角)的位置,根据五点位置将整个人脸划分为四个局部区域(左眼、右眼、鼻子和嘴巴),然后对每个局部区域分别进行形状初始化,并粗略估计每个局部区域被遮挡的程度,最后基于每个局部区域被遮挡的程度在训练集中找到最相近的人脸形状作为初始形状。本文在COFW数据集上的实验结果表明,与常用的随机形状初始化方法相比,本文方法将初始形状误差由16.13%减小至8.61%,并将最终的特征点定位误差由8.68%减小至6.74%。(2)针对人脸遮挡给级联姿态回归算法的形状索引特征带来噪声的问题,提出了一种基于特征点遮挡概率的自适应形状索引特征。被遮挡特征点的局部纹理特征被遮挡物体的纹理特征所取代,将遮挡物体的纹理特征作为特征点的局部纹理特征将会损害级联姿态回归算法的特征点定位性能。为了减小遮挡给形状索引特征带来的噪声,本文为每一个特征点的局部纹理特征赋予一个基于遮挡概率的自适应权重,遮挡概率越大则权重越小,使得级联姿态回归算法更多地依赖于没有被遮挡的特征点的纹理特征,减小了遮挡带来的噪声。另外,为了利用未被遮挡特征点的位置信息帮助被遮挡特征点定位到更为合理的位置,本文在级联姿态回归算法的每次迭代过程中利用人脸形状字典对包含噪声的人脸形状进行稀疏重构,一定程度上修正了误差较大的特征点的位置,提升了级联姿态回归的特征点定位准确度。本文在COFW数据集上的实验结果表明,与没有赋予自适应权重的传统形状索引特征方法相比,本文方法将特征点定位误差由6.74%减小至6.58%,经过人脸形状字典的修正之后特征点定位误差由6.58%进一步减小至6.24%。
其他文献
近年来,深度学习技术获得了快速发展,机器翻译领域中的相关研究也不断深入。其中,前几年出现的基于注意力机制的编码器-解码器神经机器翻译框架,在效果上彻底超越了传统的统计机器翻译框架。而最新的Transformer框架,更是将神经机器翻译的效果提升到了新的台阶。由于受到训练方法的限制,这些先进的框架在翻译的过程当中都是将句子作为一个整体来考虑的,而在实际的翻译过程中,我们面对的文本往往是由多个句子组成
东营凹陷永559区位于济阳坳陷的东南部,为北陡南缓的不对称箕状盆地,砂砾岩储层,岩体分布复杂,非均质性较强,孔渗相对较低,油气分布明显受沉积相控制,不同的相带储层物性差异
现有的指纹识别算法应用于低质量指纹图像时,由于指纹图像存在污损、断裂、伤疤和形变等问题,能够提取的有效特征变少或者伪特征变多,从而导致了指纹识别变得十分困难。国内
在大规模移动视觉搜索中,视觉描述子的紧凑性是影响检索效率的重要因素。Fisher Vector(FV)描述子是一种区分性非常强的聚合描述子,在视觉搜索应用中检索效果出色。然而对于移动或嵌入式设备有限的计算资源来说,图像全局描述子的紧凑性显得尤为重要,而FV描述子的维度太高,限制了其在移动或嵌入式设备上的应用。哈希是解决图像全局描述子紧凑性描述的有效手段之一,然而哈希在量化到低维度的二值码有较大的精
C–C键的位点和化学选择性裂解/活化以及官能团化一直是最具挑战性的研究方向之一。含过渡金属的中间体的β-C裂解为碳碳键的活化提供了潜在的有效方法。但是,由于反应中存在
随着高分子材料产品在电子、光学和医学等行业的广泛应用与需求。这些产品通常需要精度为微米和亚微米级的高分子零件,如何实现快速、可靠、可复现、高质量的制造是目前实现
为顺应资本市场改革发展的新要求,满足复杂经济背景下日益增加的信息需求,2016年12月财政部印发了新审计报告准则,其中最核心的内容是第1504号审计准则,要求上市公司披露关键审计事项,并采取分步骤实施方案。因此本文基于会计师事务所视角,从不同角度分析关键审计事项的具体经济后果。本文选取2016年——2018年披露关键审计事项的所有A股上市公司数据,通过文本分析法和Python方法得出关键审计事项的
机器人技术,尤其是移动机器人技术,已经开始在工业制造、军事、物流和室内服务领域得到越来越广泛的应用。在移动机器人的关键技术中,即时定位与地图构建SLAM(Simultaneous Localization and Mapping)和多传感器信息的融合至关重要,是移动机器人实现精确自主导航的基础。本文以Turtlebot2移动机器人为平台,配置了里程计和二维激光雷达等感知设备。首先对系统的运动模型和
随着计算机技术的快速发展,人们在努力使机器变得更加人性化,因此,本文研究如何让机器智能地生成有说服力的自然语言描述的问题,该描述既要传达产品信息,又要提供与用户需求相关的解释。这个问题可能会受益于当前大量关于端到端深度神经网络的研究工作。然而,深度神经网络的成功归功于海量训练数据的支撑,我们无法获取大规模的具有说服力的文本描述,因此,缺乏标记数据和主观判断对训练这样一个模型提出了严峻挑战。针对以上
国防工业、航空航天、汽车制造、半导体和微电子工业等领域发展迅速,超精密加工零件的数量和质量需求都急剧增长,尤其是对零件表面面形精度和粗糙度的要求与日俱增。相应地,