基于表观的人脸姿态估计问题研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:shekitito
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是计算机视觉和模式识别研究中的热点问题,近年来受到越来越多研究者的重视。同时,作为生物特征识别的关键技术之一,其在公共安全、信息安全、金融等领域具有潜在的应用前景。近年来,限定条件下的人脸识别取得了很大进展,但非限定条件下的人脸识别尚不成熟,其中姿态变化即是瓶颈之一。为了实现对不同姿态人脸的识别,估计人脸姿态通常是必要步骤之一,具有重要的研究意义和实用价值。   本文主要研究内容就是围绕多姿态人脸识别问题,研究姿态变化下的姿态估计技术。本文主要针对当前姿态估计问题中的困难问题,利用图像的表观特征,在统计学习理论的框架下,提出了一些能够有效提高姿态估计准确率的方法。本文的主要研究成果包括:   1.提出基于Gabor滤波的人脸对称性特征的提取方法。在传统的基于图像表观的姿态估计方法中,图像的特征通常通过子空间分析方法进行提取,例如主成分分析,费舍尔线性判别分析等。然而这些方法并不是专门针对姿态问题设计的,因此其提取的特征并不直接同姿态相关。另外,这些方法直接将二维的人脸图像转换成一维的向量进行处理,在一定程度上丢失了人脸的结构信息。本文认为姿态估计中应用的特征应该更加紧密的同姿态变化相关,同时对于人的身份、光照、表情和数据库的差异等因素鲁棒。基于这种思想,结合头部基本对称这一广为接受的假设,本文提出面部图像的每一行灰度特征的对称性同头部的姿态紧密相关,并且同人的身份无关,从而可以利用该对称性特征进行头部的姿态估计。具体来说,本文使用了快速傅里叶变换方法提取头部的对称性特征。为了消除光照和噪声的影响,进一步使用了一维Gabor滤波器。在不同数据库上的实验结果表明,基于Gabor滤波的人脸对称性特征能够显著的提高姿态估计的准确率。特别是在训练数据和测试数据来源的数据库不同时,基于Gabor滤波的人脸对称性特征仍然能够取得不错的实验结果,表明方法具有很好的推广能力。   2.提出局部判别能力增强的人脸对称性特征的提取方法。虽然基于Gabor滤波的人脸对称性特征与姿态紧密相关,并在姿态估计问题中取得了不错的实验结果,但是在基于Gabor滤波的人脸对称性特征的提取过程中没有显式地使用到姿态类别的信息。而在模式识别中一般认为,通过使用类别的信息,能够增强特征的判别能力。因此在本文中,为了提高特征的判别能力,将基于Gabor滤波的人脸对称性特征和费舍尔线性判别分析方法进行了有效的结合,提出了判别能力增强的人脸对称性特征的提取方法。实验表明,判别能力增强的人脸对称性特征能够进一步的提高姿态估计的准确率和鲁棒性。此外,针对姿态估计问题中的多模态问题和非线性问题,本文进一步将基于Gabor滤波的人脸对称性特征和局部费舍尔判别分析方法相结合,从而提出了局部判别能力增强的人脸对称性特征的提取方法。实验表明了该方法在姿态估计问题中的有效性。   3.提出基于类别间距的姿态判别分析方法用于提高姿态估计的准确率。在传统的判别分析方法中,计算类间散度时往往将每个类同等的对待。但是在姿态估计问题中,姿态为0度和1度的图像之间的差异要远小于0度和90度的图像之间的差异,因此姿态类别之间并不是平等的。换句话说,在姿态分类(估计)问题中,姿态类别之间可以定义距离度量。针对姿态估计问题,本文提出了基于类别间距的姿态判别分析方法。在该方法中,姿态类别之间的距离被引入到类间散度矩阵的计算中,从而使得对于不同类的样本,其姿态类别间距越大,则其对总体类间散度矩阵的贡献越小;反之亦然。换句话说,邻近姿态类别的样本之间的权重得到了提高,而姿态类别距离远的样本之间的权重被显著的降低。这种对类间散度矩阵调整的思想是基于这样事实,在样本被错分时,往往被错分到邻近的类别中,而不是与真实姿态类别距离较远的类别,因此在计算类间散度矩阵时,应该增加邻近类的权重,以使得邻近类的样本更加容易区分,从而使特征的判别能力得到了显著的增强。此外,为了保持类内的局部结构,在计算类内散度矩阵时,本文同时引入了相邻类的样本的相似性。实验表明了该方法在姿态估计问题中的有效性。   总之,通过上述工作,本文对姿态估计问题进行了深入研究,研究结果表明:基于Gabor滤波器的对称性特征更加与姿态估计问题紧密相关,能够充分的反映姿态信息;通过进一步和线性判别分析相结合,提高对称性特征的判别能力后可以有效地提高姿态估计算法的准确率。
其他文献
目前,IPv6技术已逐步走向成熟,IPv6网络规模正在扩大,一些国家已经建成了纯IPv6骨干网络。IPv6网络正逐步走向实用,出现了大规模IPv4网络通过IPv6网络互连的需求。隧道机制作为IP
“软件人”是具有拟人智能的、生存并活动于计算机网络世界中的一类软件人工生命,是一种“虚拟机器人”,具有拟人属性、拟人功能、拟人行为和拟人结构。“软件人”概念的提出为
广播是无线自组织网络(简称无线自组网)中最基本的数据传输方式之一,常用于消息扩散、路由建立、数据查询、服务发现等多种场景,是无线自组网的一个重要研究方向。近年来,作为一
IMS即IP多媒体子系统,是一种定义在IP技术基础上的网络体系架构,可以提供语音视频等多媒体服务,是为业界公认的未来互联网发展的关键技术架构。运营商采用了多种技术确保IMS
随着计算机网络的迅速发展,网络设备的种类和数量越来越多,网络结构变得越来越复杂。如何更加有效地管理网络设备、保障网络的正常运行,以及如何设计高效、稳定、通用、可扩展的
随着集成电路设计的规模越来越大,设计验证的重要性越来越突出。由于具有良好的可扩展性,模拟验证一直是功能验证的主要手段。然而随着设计复杂性的持续增长,模拟验证的不完备性
信息融合算法是信息融合测试评估体系中重要的评测对象。如何复用信息融合算法,并以此提高算法开发过程中的自动化程度和效率,是信息融合领域中研究的一个重点和难点。   根
在对软件产品依赖度日益增加的今天,软件测试已经成为软件开发过程中极其重要的环节。其中,回归测试作为普遍的保证软件质量的测试方法引起了越来越多的关注,主要原因在于回归测
随着互联网的飞速发展,大量网页内容的重复给人们带来了不便。在过去的十多年中,在线视频量呈指数增长,越来越多的人参与到了video-related活动,用户花在视频采集、编辑、上
随着计算机技术的应用日臻成熟以及信息化管理的程度不断加深,计算机辅助审计已经成为审计工作的必然方向和趋势。教育审计是我国审计监督制度的重要组成部分。近年来,随着高校