人脸图像对齐相关问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ok_qq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会科技的进步与发展,人员的交往和流动日益频繁,安全问题也越来越得到人们的重视。在各种安全问题中,身份的认证和识别成为了现代安全的核心问题,人们几乎时刻都需要鉴别别人的身份和证明自己的身份。一些传统的身份识别主要基于和身份相关物品(如护照、身份证等)和身份相关知识(如用户名、密码等)来识别身份。而基于生物特征的身份识别相对于传统的身份识别具有稳定性、便携性等特点。在各种生物特征识别中,人脸识别相比其他生物特征识别方法具有直接、友好、方便的特点,因此人脸识别成为了近些年身份识别研究的热点问题。  一般人脸识别系统包括:检测、跟踪、对齐、识别等步骤,人脸检测是判断图像或视频中是否存在人脸,如果存在则给出人脸位置。检测出人脸之后一般还需要对人脸进行跟踪,即确定帧间对齐变换参数,把前一帧人脸图像位置变换到当前帧位置,以更加鲁棒、快速的定位人脸。人脸对齐指的是把人脸图像变换矫正到正面脸图像。人脸对齐在本论文中被分为无监督和有监督方式。其中无监督对齐指的是不需要指定的参考点,自动对一批图像进行对齐。有监督对齐其核心内容在于检测出人脸关键点,然后根据关键点计算相应的变换参数,之后对人脸图像进行对齐。人脸识别指的是对矫正后的图像抽取相应的特征并且选择合适的度量距离进行比对,判断人的身份属性等。由于现实生活中人脸图像越来越多,对一批人脸图像进行管理时候往往需要把图像自动的分成不同的类别,以方便后续查找等需求。人脸图像聚类可以为人脸图像预先打上一定的标签,降低人工标定、鉴定识别的工作量,人脸聚类也可以对识别的数据库进行分类,提高检索速度,用于人脸视频检索,人脸视频内容分析等。  本文所研究的问题以人脸对齐为中心,涉及到图像对齐和聚类、关键点检测以及视频跟踪等内容。本文的主要贡献如下:  1.提出了基于低秩约束的同时对齐和聚类模型。相关的研究表明图像的对齐和聚类是相互关联的两个任务,同时解决这两个任务有助于提升各自的性能。在子空间分割基础上,我们提出了基于低秩约束的同时对齐和聚类算法,该算法把图像对齐成功的引入到传统的子空间聚类算法中,用同一个目标函数解决了图像的对齐和聚类问题。所述目标函数用迭代的增广拉格朗日方法求解,在标准图像集上与不同方法对比证明了所提方法的优越性。  2.提出了基于形变不变性的聚类方法。在对齐样本的同时学习相应的子空间表示,使得所提出的聚类方法对图像平面变换比较鲁棒。通过对齐,变换后的图像变得高度相关,因此可以获得更好的一个相似性矩阵。联合学习问题最后转化为了一些列的较好求解的最小二乘问题。同时还证明了经典的Least Squares Congealing人脸对齐方法是我们方法的一种特殊形式。在非可控环境下的真实数据集上的结果显示,我们的方法要优于现有的一些子空间聚类方法和其他的一些同时对齐和聚类的方法。  3.提出了基于多任务自编码器的两阶段人脸关键点检测模型。在传统单一任务关键点检测基础之上,同时进行关键点检测和姿态估计。在第一阶段,多任务自编码器进行关键点的粗定位,在第二阶段,多任务自编码器进行关键点的精定位。两阶段的自编码器保留了人脸形状信息,从粗到精的精细化定位关键点。所提方法比其他基于深度学习的关键点检测算法复杂度低,运行时间短。在有挑战性的数据库上的实验显示了我们方法的有效性。  4.提出了基于全局级联卷积神经网络关键点检测方法。所提出算法考虑了关键点之间相互影响,把不同部位关键点周围提取的区域输入到一个卷积神经网络之中,通过卷积神经网络自动学习关键点之间关系。算法利用了形状约束信息,在卷积神经网络数目较少情况下取得了较好的定位效果。在非可控环境数据库上的测评表明,所提出算法适用于比较有挑战性的关键点检测任务,对光照、遮挡等比较鲁棒。  5.提出了基于相关熵的鲁棒视频跟踪算法。针对传统的在线子空间跟踪算法对噪声比较敏感,用相关熵对非高斯噪声进行建模,提出了基于相关熵的鲁棒视频跟踪方法,所提跟踪方法对光照、遮挡、运动污染等比较鲁棒。由于目标函数的非凸性质,采用迭代的半二次最优化方法求解。另外根据信息论的相关知识,设计了一个新颖的在线更新模板。在公开的数据库上的测评验证了我们的跟踪算法比其他一些主流跟踪算法效果要好。  综上所述,我们以人脸对齐为主线,深入分析了图像的对齐和聚类、关键点检测、视频跟踪等存在的问题,并提出了相应的解决方案,提升了人脸图像的对齐和聚类性能,提高了关键点检测和视频跟踪的精度,有助于提升人脸识别系统的性能。
其他文献
如何让机器人实现高精度、高柔顺性的操作,是机器人研究领域长期关注的问题。在机器人学与控制科学、机构学、材料学和计算机科学等交叉领域,已从不同角度对这一问题进行了研究
行人再辨识是多摄像机视频监控中的一个重要任务,其目标在于将多路摄像机在不同时间和地点捕捉到的行人进行自动关联,为行人目标的行为和活动推理分析提供基础。在视频监控中,不
随着机器视觉和图像处理技术的不断发展,视觉目标检测、跟踪及测量技术得到了广泛应用。在航空航天领域中空中目标的视觉检测、跟踪及测量日益受到重视,特别是在空中复杂条件下
本文旨在用智能控制的理论和方法设计特性良好的混沌同步控制方案,并基于DSP进行混沌同步语音保密通信的研究。首先简要分析了现有混沌同步的主要智能控制方案和混沌同步用于
在最近的几年中,计算机技术得到飞速的发展,嵌入式设备使用的芯片主频已经达到400MHz以上,使移动设备具备了进行一定程度的音视频的编解码的能力。无线通信技术也从普通的提
人脸属性识别在人机交互、安防系统等众多领域有着广阔的应用前景,受到了研究者们的广泛关注,已成为计算机视觉和模式识别领域的热点研究课题。目前,由于样本多样性、数据收集困
高可靠性、分散性、开放性、经济实用性和工厂化已经成为现代工业控制系统的特点和要求。本文在对计算机控制系统、现场总线控制系统发展历史的回顾与总结的基础上,提出了Dev
本文重点研究IrDA(InfraredDataAssociation,红外数据协会)协议栈在嵌入式环境下的编程实现,将程序写入目标芯片,使其通过目标板上的红外收发器与移动通信设备(手机)的红外口能
目标跟踪技术是计算机视觉的一个经典问题。它是视频内容结构化过程中连接目标检测与高层行为语义的重要桥梁,同时也为高级人工智能所需要的环境感知和行为决策控制提供了重要
节能技术的研究和节能产品的开发是工业技术发展的重要方向之一,变频调速技术的发展为能源的进一步节约提供了可能。论文在分析传统的单变量控制原理缺点的基础上引出双变量控