非特定环境中人脸识别方法与应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xyfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别在安防、军事、金融等众多领域有着广阔的应用前景,受到了研究者们的广泛关注,已经成为计算机视觉和模式识别领域的热点研究课题。目前,在特定或可控的环境下,人脸识别已经达到了比较满意的效果,基本上可以达到实用的需求;然而在真实的自然环境中,由于光照、表情、姿态、成像条件等一系列非可控因素的影响,人脸识别的性能会急剧下降,难以满足实际应用的要求,从而限制了其在实际场合中的应用与推广。@本文对非特定环境下的人脸识别问题进行了深入的研究与分析,针对其中的关键问题和难点,提出了相应的解决方法。主要的工作和贡献有:  (1)针对非特定环境中的人脸认证问题,从设计一个好的分类器或选择一个合适的距离度量的角度,提出了两种距离度量的学习算法。人脸认证,简单来说,就是判断两幅人脸图像是否属于同一个人。这个问题的一个关键难点是如何有效的计算两幅人脸图像之间的相似度。度量学习是解决相似度计算的一个最直接的方式。我们提出的第一种方法是基于卡方距离的度量学习算法。该方法结合了在人脸识别等计算机视觉问题中经常用到的(如SIFT,LBP等)统计直方图特征的优点,以及人脸认证问题的目标,提出学习一个线性变换,使得该线性变换能够在一定程度上克服人脸由于光照、姿态、表情等因素带来的人脸表观变化;并通过该线性变换将人脸图像变换到一个共同的子空间中,使得在该子空间中,在卡方距离度量下属于同一个人的图像之间的距离尽可能小,而属于不同人的图像之间的距离尽可能大。第二种是基于环境耦合的度量学习方法。该方法首先针对自然环境中人脸图像会受到多种环境因素的共同影响的问题,从数据驱动的角度,提出了基于结构化相似度的谱聚类算法,来隐式地估计人脸图像所处的拍摄环境;然后针对单一的变换矩阵不足以描述人脸图像由于多种环境因素带来的变化问题,提出了在度量学习的约束下,对不同环境中的人脸图像学习不同的变换矩阵,从而将人脸图像映射到一个耦合空间中,然后在耦合空间中完成人脸认证的任务。本文将提出的算法在国际通用的LFW数据库上进行实验,并与传统的度量学习算法进行了比较,实验结果充分验证了我们方法的有效性。  (2)针对非特定环境中的人脸认证问题,从学习特征表示的角度,提出了基于深度独立子空间分析网络的人脸特征提取方法。传统的特征提取方法大都是研究者们在结合问题的特性以及研究中积累的经验的基础上而设计的,需要较多的人工参与。深度神经网络可以自动地从图像中学习其特征表示,并且近几年来在计算机视觉相关的问题中,取得了非常不错的效果。我们结合人脸这一特定的图像结构,以独立子空间分析网络作为基本的局部网络,设计了一个分块、多层的深度神经网络。对于网络连接参数的设置,我们采用预训练的方式来获得网络的初始连接权重,然后针对人脸认证问题,结合度量学习的约束条件,设计了相应的目标优化函数,来微调网络的连接权重。在实验中,我们从原始像素空间和底层特征空间学习图像的特征表示,实验结果表明我们的方法能够较好的克服在非特定环境中人脸图像由于多种环境因素带来的变化,并提取出紧凑的、具有判别性的人脸特征表示,从而提升了非特定环境中人脸认证的性能。  (3)针对非特定环境人脸识别中的一个重要的难点问题——多视角人脸识别,我们提出了基于隐最小二乘回归的多视角图像匹配框架。该框架关联了两个空间之间的关系,一个是观测到的图像空间,另一个是身份空间。在身份空间中,每个人由一个身份向量表示,并与视角无关。该框架的基本假设是同一个人在不同视角下观测到的图像,可以由其在身份空间中的身份向量通过与其视角相关的映射变换得到。我们在最小二乘意义下形式化表示这个假设,提出了轮替优化的求解方法,并引入正则化技术,提高了解的泛化能力,取得了比现有方法更好的识别性能。  总的来说,本文从分类器设计和特征学习的角度,对非特定环境中的人脸认证问题,提出了相应的解决方案;并针对非特定环境人脸识别中的难点问题——多视角人脸识别,建立了一个有效的问题表示模型。本文的工作为促进人脸识别算法的性能提升和走向实际应用做了有益的探索和尝试。
其他文献
该论文研究的是在车辆运行情况较为复杂的条件下,具有很强的容错功能的计辆系统的设计问题.系统中,基层数据采集单元只负责车辆轴距的计算和车辆运行方向的识别,最后将一组有
学位
学位
邮政包裹分拣机故障诊断及邮政中心局信息管理系统是邮政综合计算机网的基本单元,作为二者提供数据的基础,该文在现有以PLC为电控器件的包裹分拣机系统的基础下,利用PLC的通
三相交流异步电动机具有结构简单、制造容易、价格便宜、坚固耐用、运行可靠、很少维修、使用环境及结构发展不受限制等优点,在工、农、国防等诸多领域得到了广泛的应用。  
学位
在数字化和网络化的电视台制播系统中,媒体资产包括电视节目播出的各种素材资料,如音视频、图片、数字化的文本、模拟录像带、录音带、图表等信息,它是电视台网络制播系统的
该论文系统地论述了社会信息化评价的理论和方法;给出了社会信息化发展规律的微分模型;给出了社会信息化发展各阶段的特性以及相应的调控对策;该文在前人研究的基础上建立了
锂电池具有容量大、寿命长、工作电压大、可循环利用且没有记忆效应等诸多优点,使其成为近年来新型能源开发的热点。锂电池出厂前必须要经过化成检测工序以保证电池的质量,随着锂电池市场的迅猛发展,市场对锂电池化成检测设备的要求也越来越高。目前市场上锂电池化成检测系统的设备级控制器大多采用单片机,这样现场控制级只能实现简单的控制功能,复杂的控制还需要由远程工作站实现,设备的独立工作性能较差。因此设计并开发具有
该文作者结合自己在用R/3系统构建新华书店总店企业网上的工作学习的经验与体会,剖析了R/3系统工作的基本原理;研究了R/3应用系统的设计思想;构造了用户原型;提出了ERP软件的