高精度人脸识别算法研究

被引量 : 43次 | 上传用户:maitianquan159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是一个古老而又年轻的学术问题,人们对它的探索已经跨越了三个世纪。早在1888年,《Nature》杂志首次发表了利用人脸进行身份识别的文章,掀开了人类对人脸识别探索的序幕。120年后的2008年,《Science》杂志刊登了关于“100%自动人脸识别精度”技术评论,指出现实环境下的高精度人脸识别仍然是一个遥远的目标,需要我们持续开展创新的研究工作。人脸识别是一个特殊的复杂模式识别问题,它具有:1)训练集合的高维性和小样本性;2)图像的类内变化远大于类间变化;3)特征空间内样本的结构复杂等特点。然而,现有的识别算法大多从特定目标函数出发,缺乏对人脸自身属性的考虑。它们虽然能够从数学上很好地描述具有固定变化的数据集,从而取得很高的识别精度,却不能解决现实复杂环境下的人脸识别问题。为了从根本上提高技术水平,使得算法能够应对现实环境的复杂性和不可预测性,本文引入了两个人脸识别的新思路。第一,从人脸类别在特征空间中的类别分布特点出发,利用人脸类别分布的先验知识,设计适应人脸自身属性的新特征提取算法;第二,引入心理学、神经科学等跨学科知识,利用多层次的仿生手段,设计生物启发式人脸特征提取算法。以这两种思路为指导,面向现实环境下的高精度人脸识别需求,本文主要进行了如下研究:(1)从全局散度分析、局部重叠分析、流形结构分析和分类错误四个角度出发,利用实验手段探索了人脸图像空间中的类别分布特性。各个类别的人脸图像在测量空间中呈现出相似的结构,而且高度重叠。基于人脸类别结构的特殊性,提出人脸空间类别分布的两个先验假设:第一,每类的协方差矩阵相等,同时类内散度远大于类间散度,使得每类的协方差矩阵都近似等于全局的协方差矩阵。第二,不同人之间的类间散度存在于同一子空间中,而且该类间子空间的主方向与类内散度的子空间主方向是不“冲突”的。这两个先验知识使得算法可以不用局限于特定人的训练集合,转而采用大规模的通用数据库对人脸识别中的特征抽取模型进行训练。在FERET数据库上的大规模实验证明,在基于类别结构先验知识的通用学习框架下,采用经典线性鉴别分析方法就可以获得大大超过国际评测最好结果的精度。(2)通过对当前特征抽取算法的深入分析,提出了一个基于投影寻踪技术的算法框架,统一了主成分分析、独立成分分析、线性鉴别分析、局部保持投影、非监督鉴别投影等主流的特征抽取算法,给出了人脸识别中的特征抽取问题的一种新颖的综合性表述。在投影寻踪框架中,算法首先通过白化变换对数据进行预处理,随后利用优化技术寻找具有最优投影特性的低维投影向量。基于投影寻踪框架的实验验证了当前的非监督特征抽取算法都不能很好地寻找低维特征投影,它们在人脸识别中的高性能主要来源于白化过程对人脸类别结构的变换,而并非以往研究中声称的低维投影。为了充分利用人脸类别结构的先验知识,本文提出了一个局部寻踪算法,在白化空间内最大限度地保持样本的局部邻近特性。在AR和FERET数据库上的实验表明局部寻踪算法的非监督和监督版本、线性和核版本都能获得高于当前同类算法的精度。(3)从“样本均匀化”的几何直觉出发,提出了局部离散寻踪算法,解决单训练样本条件下的人脸识别难题。该算法的目标是使得在特征空间中靠近的类别变得分散,降低类间样本混淆的风险,从而提高识别精度。局部寻踪算法引入了两种样本均匀化的新方法:第一,基于奇异值分解的新白化变换理论—该变换可以在小样本情况下把训练样本集变换成一个规范正交集,使得样本间距完全均匀。第二,局部离散投影—对主成分分析进行局部化改造,可以在降低数据维数的同时使得原来局部聚集的样本变得稀疏。该算法的核版本能够进一步提高算法对非线性结构的学习能力,在使用更小量的特征的情况下获得同等精度。在包含1196人的大规模FERET数据库上,局部离散寻踪算法仅采用每人单样本的训练就可以获得远远高于FERET’97评测最好结果的精度水平。为了进一步提高精度水平,本文还提出了融合通用特征模型和特定人特征模型的人脸识别新方法,在FERET评测的duplicate测试图像集中的识别精度超过90%,为该测试集至今发表的最高识别精度。(4)从心理学、神经科学与模式识别的交叉性出发,提出一种多层次的生物启发特征提取方法。该方法包含三个层次。第一,在低层特征生成阶段,采用了一组源于视觉通路早期阶段响应特性的生物启发式特征来表示人类图像。这些特征针对多方面的视觉特性,涵盖了空间局部性、空间频率选择性、边缘方向选择性、色度选择性等。第二,从低层特征到高层特征的映射采用了一个增量式的鲁棒鉴别分析模型。首先使用增量式主成分分析方法把高维低层特征映射为通用的中层特征,再使用鲁棒鉴别分析模型映射为专用于身份识别的高层特征。第三,对不同的人脸特征进行独立的编码,形成独立的视觉通路。最后的识别决策融合了不同的视觉通路得到的多个人脸编码的相似度。生物启发式人脸识别系统模拟了复杂的人类信息融合策略,有效地整合各种信息源获得稳定的人脸识别性能。FRGC版本2实验4中,生物启发式系统获得了超过93%的验证率,不仅超过了FRGC2005评测的最好性能,而且为目前在该标准实验中发表的最高识别精度。
其他文献
市场状态与交易者行为的相互关系以及信息性交易的准确测度,是指令驱动市场微观结构理论的研究热点和难点。论文分三部分、各两章内容研究市场状态如何影响交易者行为、交易
随着近年来互联网技术和信息技术的飞速发展,人们可获取的数据量迅速增长。如何快速、准确、全面地从浩瀚的信息资源中寻找到所要的狭小领域内的相关信息内容,已经成为了一项
电子市场的兴起,带给消费者、厂商等市场参与者诸多影响。其中一个现象是市场中产品种类越来越多,同时销售分布越来越分散。学者将这一现象定义为长尾现象。长尾现象的出现让
针对目前西部小城镇居民饮用水供给的特点以及常规处理工艺在满足新的水质标准方面的不足,课题组研制出了具有操作方便、占地面积小、运行成本低等特点的一体化净水装置。该
城市行政中心是城市公共空间的重要组成部分,由于其重要的地位及政治职能,常常位于城市的重要地段,并成为城市能量发散、信息聚集发布的核心区域,在相当大的程度上反映了城市
互联网在当前的社会生活中已经越来越占据重要的位置。随着信息科技的进步和社会经济水平的发展,互联网规模迅速膨胀,网络流量、用户规模等互联网组成部分快速增长。随着移动
在很多数字媒体应用领域里,需要用到具有高分辨率的图像或视频来表示物体的细节部分、动作过程等。但实际应用中,人们得到的常常是一系列低分辨率的场景图像,关键的信息不能
随着集团客户移动信息化的快速发展,集团与行业客户已经成为电信运营商发展的重点。由于各类移动数据业务的推广和企业移动办公业务的广泛使用促使行业网关建设的需求迫在眉
随着我国经济的高速发展和银行体制改革的不断深化,以“客户为中心”的新的经营理念在我国的银行业开始得到共识,许多银行在产品和服务创新上下功夫,进一步贴近客户,为户口提
以胸鳍棘作为年龄鉴定材料,对2007年6月至2008年5月采自赤水河中游的511尾大鳍鳠(Mystusmac-ropterus)的年龄结构和生长特性进行了研究。结果显示,6—7月为新年轮形成的高峰期;