基于姿态正规化的人脸识别关键技术研究

来源 :中国科学院大学(中国科学院重庆绿色智能技术研究院) | 被引量 : 0次 | 上传用户:cj258399542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉领域中研究最为广泛的课题之一,人脸识别近年来取得了很大进展。但是在复杂的非约束场景下,人脸识别系统的各个关键技术模块,如人脸检测、关键点检测和特征提取等,仍然受到光照、姿态、表情和遮挡等多种因素的制约。与其它因素相比,不同姿态的人脸呈现出更为明显的纹理和特征差异,极大地限制了人脸识别在实际场景中的应用。基于姿态正规化的人脸识别,在对人脸特征判别之前预先进行人脸角度的校正,能够有效降低姿态变化对特征的类内紧密性和类间可分离性的影响,是人脸识别技术的一个研究重点和热点。然而,这种方法仍然面临以下问题:1)姿态正规化模块对人脸关键点的检测精度较为敏感,而复杂场景下人脸关键点的检测性能仍有较大的提升空间;2)姿态正规化模型的图像重建能力受限于训练集数量和规模,而不同的数据集之间又存在显著的分布差异,采用单一约束条件的深度模型难以完成在多个数据集上的统一训练;3)姿态正规化与特征提取模块相互独立、缺少联系,前者产生的错误会直接传递给后者,进而影响最终的特征判别。这些问题给现有的基于姿态正规化的人脸识别方法带来了重大挑战。在此背景下,本文以减弱和消除姿态变化对人脸纹理分析和特征判别的影响、提高复杂环境下的人脸识别准确率为目标,围绕如何提升系统各技术模块的性能以及如何增强各模块之间的联系这两个研究问题,对基于姿态正规化的人脸识别各个关键技术进行优化和改进。本文的主要研究成果包括以下四个方面:1)针对现有人脸关键点检测方法对大角度人脸预测精度较低的问题,本文提出了一种基于关键点热图和部件关联场的人脸定位和关键点检测方法。针对不同角度和遮挡导致人脸信息的非结构化问题,该方法利用全局图像的上下文信息,对人脸关键点的热图和关联性响应进行联合学习,以自下而上的方式完成人脸基准关键点的直接定位;进一步地,针对不同姿态人脸特征的多模态不确定性,该方法通过引入深度卷积多分支回归网络,将人脸依据姿态信息分配至各自的特征空间,进而完成不同姿态人脸稠密关键点的精准预测。本文对该方法在AFLW、300-W和Menpo三个公开数据集上进行了评测。实验结果表明,该方法对较大姿态和严重遮挡的人脸均有较强的鲁棒性,能够有效提高复杂场景中人脸关键点的检测精度。2)与研究成果1)的切入角度不同,本文又针对人脸关键点检测方法面临的另外两个容易被忽视的问题,即回归模型的检测精度对人脸初始位置和关键点标注不一致较为敏感,提出了一种基于深度渐进初始化网络和误差驱动学习的人脸关键点检测方法。一方面,在全局到局部的级联回归结构中,引入监督空间变换网络,根据人脸整体和各部件的图像输入,自动学习空间正规化变换的最佳参数,降低深度回归网络对关键点预测的推理难度;另一方面,在模型训练过程中,采用自适应关键点加权损失作为目标函数,根据关键点的学习误差动态调整反馈梯度大小,避免由于关键点标注不一致所导致的模型过拟合。本文对该方法在300-W、AFLW、COFW和WFLW等公开数据集上进行了测试。实验显示,该方法能够有效提高回归模型对不同人脸检测器的适应性,并且显著降低了人工标注噪声对模型参数学习造成的不利影响,相应模型在各个数据集上的关键点检测精度超过了其它现有的同类算法。3)为了增强基于3DMM(3D Morphable Model)的姿态正规化方法对人脸关键点检测错误的鲁棒性,本文提出了一种基于自适应姿态正规化的人脸识别方法。在对一张任意姿态的人脸图像进行3D几何变换前,该方法首先在2D空间中将其映射至预设的正面人脸模板上,用于简化摄像机标定的内参估计流程;然后使用随机抽样一致算法和人脸特性相结合的方法,迭代选取和3D模型结点匹配度较高的关键点,求解最终的姿态正规化参数,从而减少关键点检测噪声对合成正面人脸图像质量的影响。本文在公开人脸数据集LFW上,采用了两种评测协议对该方法进行了评测。结果表明,该方法能够有效减小同一身份、不同姿态的人脸特征之间的类内差异,并显著提升了非约束场景下的人脸识别准确率。4)针对基于GAN(Generative Adversarial Networks)的姿态正规化网络受制于单域数据集规模以及与特征提取模块之间缺少关联这两个短板,本文提出了一种基于深度自适应姿态正规化网络的多姿态人脸识别方法。该方法在模型学习过程中,采用自适应加权损失函数弥合多域数据集的分布差异,实现了一个端到端的由识别任务直接驱动的深度姿态正规化网络;同时基于图像质量感知完成多通道特征的线性融合,进一步提升了特征提取模块对多姿态人脸信息的表达和区分能力。本文对该方法在Multi-PIE、LFW、CFP和IJB-A四个公开人脸数据集上进行了测试。结果表明,该方法能够有效改善人脸姿态正规化的图像质量,并且在约束和非约束场景下的人脸识别准确率均超过了现有同类算法。
其他文献
高温超导和拓扑超导是近年来凝聚态物理中的两个重要的前沿研究方向。铁基超导体是继铜氧化物超导体后的第二个非常规高温超导体家族,自发现以来获得了极大的关注。铁基超导体较高的超导转变温度很难用传统的基于电-声子机制的BCS理论解释,目前广泛接受的图像是基于反铁磁自旋涨落s±配对形式,即空穴口袋和电子口袋超导序参量相位相反。Fe(Te,Se)作为铁基超导体的一员,具有大小近乎相等的电子和空穴型费米面,因此
声辐射力是声场的非线性效应,是声场与物体之间动量传递的结果。科学技术日益发展的今天,对微小粒子进行非接触操控越来越重要。与其他适用于粒子操控的力相比,声辐射力具有生物相容性高、无创、操作无标签、可操控粒子类型范围广、尺度跨度大等优点。这些优点使得声辐射力操控在生物物理、超声医学等领域有着广泛的应用前景,成为声学领域的研究热点之一。随着科学技术的进步,声辐射力操控技术有了长足的发展,但是在理论以及定
新型荧光材料一直是理论研究的前沿热点,也是产业应用的迫切需求;几十年来,荧光材料已广泛应用于显示照明、化学传感、分子探针、生物成像、转光农膜、靶向治疗等领域。理想的荧光材料通常具有颜色/强度可调、聚集态发射强和斯托克斯(Stokes shift)位移大等优点,而目前报道的相关研究还难以兼顾这些优点。本文将具有聚集诱导发光(aggregation-induced emission,AIE)性质的发光
随着全球各大经济体对汽车工业领域突出的节能、减排和安全等问题的日益关注,各大经济体对轻量化材料及其精密成形技术均提出了很高的要求。先进高强度钢板以其价格低廉、强度超高、组织性能稳定等特性,在汽车轻量化材料蓬勃发展的今日仍占有着非常重要的市场,并且在未来几十年内或将继续保持其重要地位。然而,强度等级较高的先进高强度钢板在冷成形时由于超高的回弹引起的零件尺寸偏差大、装配困难等问题,给实际生产带来了巨大
含氮杂环化合物是最重要的杂环化合物之一,具有特殊的物化性质、生物活性和药物价值,在化学、生物、药物等领域中有着广泛的应用,特别是在药物化学中占有显著的地位。本论文围绕“无金属条件下多组分反应构建含氮杂环”这一主题,以简单易得的化合物为原料,开展了多组分反应一锅生成含氮杂环的研究,研究内容主要包括以下六个方面:1、开展了以廉价铵盐作为氮源、温和条件下基于C-H键直接功能化反应的多组分含氮杂环生成反应
随着科技新能源和信息产业的快速发展,熔融石英陶瓷已经成为一种重要的战略材料。近年随着环保能源不断被重视和发展,太阳能作为绿色能源受到世界各国的普遍重视,得到了广泛的开发和利用,石英陶瓷坩埚是太阳能电池用于多晶硅铸锭炉的关键部件,因此相应的大尺寸薄壁熔融石英陶瓷坩埚的用量也在急剧增大。石英陶瓷坩埚的生产技术难度大、原料纯度要求高、使用环境苛刻,其机械性能又限制了石英陶瓷在各领域的应用,因此改善石英陶
在胚胎发生过程中,上皮组织是器官发生的先决条件,其中上皮向间质转化(EMT)和反向MET交替发生以实现器官形态发生和重塑。虽然EMT过程在器官发生中已被广泛研究,但对MET过程的理解在很大程度上还是缺乏的。最近的研究提示出MET在早期心脏发育中的参与,但尚未进行系统的探索。在心管融合过程中,第一心场,也即心脏新月区的心脏祖细胞在腹侧中线形成上皮片。而来自前第二心场(a SHF)的的间充质样的心脏祖
第一部分烟曲霉感染时CEBPD和PTX3表达的变化目的:体内和体外实验探讨烟曲霉感染时CEBPD和PTX3的表达变化。方法:利用烟曲霉孢子刺激THP-1细胞和C57BL/6小鼠,检测CEBPD和PTX3蛋白表达变化;同时收集肺曲霉感染患者手术切除的肺组织蜡块,检测肺组织中CEBPD和PTX3蛋白表达;生物信息学数据库预测CEBPD在PTX3基因启动子序列中潜在的转录因子结合点。结果:(1)与正常对
3D(三维)折线焊缝大量存在于海工装备、大型起重装备、物流运输装备等制造领域中,属于典型的复杂轨迹焊缝。3D折线焊缝工件由不同折角角度的折线板和平板通过定位焊缝装配而成,通常为大型构件,难以使用高精度夹具严格固定其位姿,且通常为中厚板,要求摆动GMAW(熔化极气体保护焊)工艺。目前,3D折线焊缝几乎全部通过人工焊接。与此同时,也存在机器人离线编程模式或示教模式实现自动焊接。机器人离线编程模式和示教
非线性时间序列的复杂性及相似性广泛的存在于复杂系统之中,因此准确的度量时间序列的复杂性及它们之间的相似性至关重要。虽然研究表明多尺度熵方法是一个有效的度量时间序列复杂性及相似性的技术。然而依然存在这样的三个问题:(1)如果两个时间序列同时都受到第三方的影响,现有的多尺度熵方法将难以得到它们真实的同步性;(2)两个时间序列之间的非同步性未必总是对称的;(3)当时间序列较短时,多尺度熵方法也许无法获得