非可控环境下人脸识别关键技术研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:en2113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过半个多世纪的发展,计算机人脸识别技术取得了长足的进步。目前,可控环境下的人脸识别取得了满意的识别效果。然而,非可控环境下的各种干扰因素会严重地影响人脸识别系统的性能指标。这些干扰因素来自于不同方面,既有信号层面上的数据获取问题,也有特征层面上的特征提取问题,同时还与核心识别算法的泛化性相关。因此,非可控环境下的人脸识别研究成为近年来计算机图形学、计算机视觉、人工智能等研究领域中极具挑战性的研究课题。本文对人脸识别技术进行了系统性的研究。针对非可控环境下人脸的姿态、表情、遮挡、低质量等变化问题提出相应的见解和解决方案。本文主要工作和创新点包括:一、提出基于关键点与高斯加权的原始特征预处理方法。目前,纹理与形状是人脸的两种主要特征形式,且各具特色。如何将两种特征融合起来,是摆在研究者面前的一个难题。本文提出一种基于二维空间的融合人脸纹理和几何形状的新特征。新特征只需简单地提取人脸5个关键点,然后根据每个像素点与关键点之间的距离对纹理特征进行动态加权。新的特征以原始的纹理特征为基础,融合了人脸的关键点和几何形状特征,与原始纹理特征相比更具鲁棒性。这种特征加权的方法为探索原始特征预处理提供了一种参考途径。二、提出基于因子分析的特征提取方法。在深入研究特征子空间分析的基础上,从因子分析的角度出发,首次提出因子分析准则框架,指出对因子分析框架方法的研究可以从两个方面着手:①针对不同的应用对象,提出不同因子分离变换;②寻找最符合模式分类的权值分配方案。同时,证明经典的PCA、LDA和LPP是该框架的一个特例,并利用因子分析框架提出基于因子分析的LDA和LPP人脸识别方法。三、提出多示例学习人脸识别方法。将目前基于分块/分部/部件的人脸识别统一为基于多示例学习的人脸识别方法,指出此方法的两个关键问题:一是多示例定义,二是多示例的融合。针对多示例学习中的两个关键问题提出相应的解决方案,并与稀疏表示分类方法相结合取得了满意的效果。四、提出分辨率尺度不变的人脸识别方法。借助高低训练字典对,采用线性组合的特征提取方法,提出分辨率尺度不变特征(RSIF)的人脸识别方法。RSIF突破了常规的直接特征提取方法,为特征提取与模式识别提供了一种新的解决方案。五、稀疏表示分类方法的改进。稀疏表示分类(SRC)是目前比较热门的分类方法,对人脸噪声、遮挡、光照具有很好的鲁棒性。但是,SRC存在“小样本”和“稠密对应”问题,为了克服这两个问题,本文提出基于SRC和多示例的人脸识别方法。六、三维人脸建模方法的改进。形变模型与明暗恢复形状(SFS)是目前主流的两种三维人脸建模方法,但这两种方法各有优缺点。本文充分利用两种方法的优点,提出丛于局部形变模型与SFS的三维人脸重建方法。对于3D-2D人脸识别,由于姿态变化会导致生成的二维虚拟人脸的纹理误差,本文提出纹理补偿的解决方案。七、超分辨重建方法的改进。针对人脸对象的特殊性,充分利用人脸多尺度一致性和非局部相似性,对基于字典学习的人脸超分辨方法进行改进,提出非局部相似与多尺度线性组合的人脸超分辨方法。与传统的基于字典学习的方法不同,本文利用人脸的非局部相似性来解决人脸超分辨的噪声和计算复杂问题。实验结果表明,该方法不但具有很好的视觉效果还具有不错的识别效果。
其他文献
本文主要研究来源于流体动力学和稀薄气体动理学理论(kinetic theory)的两类非线性偏微分方程定解问题的整体适定性以及整体解大时间渐进行为的精细刻画,主要内容包括可压缩Navier-Stokes方程组在一维以及高维对称情形下大初值整体解的存在性及大时间行为,以及带摩擦外力的Boltzmann方程的软势情形在全局Maxwellian附近的整体解的构造.全文主要分为两大部分.第一部分我们研究可
解决某一具体领域问题通常难以完全依靠单一的知识源,而是会以多个知识源的协同为基础,这是因为有时一个知识源无法解决问题,而多个知识源共同协作能够提供适合的解决方案。因此要解决问题的领域专家就转而求助于将不同来源的相关知识进行集成,以构建一个能够解决具体应用问题的知识对象。知识集成的目标是生成一个全面的知识库,但是由于对知识源整体的集成会加剧在多个知识源之间实现互操作的复杂性,因此,为了在获得满足问题
自从Tim-Berners Lee提出Semantic Web之后,本体的研究逐渐引起了许多人的关注,并被应用到许多领域。在信息管理领域,由于信息的异质异构导致了“信息孤岛”的问题。针对这一问题,许多研究者都提出了不少解决方案,包括如数据联邦,中间件,数据仓库以及分布式数据库等方法,但都面临着无法很好地解决语义冲突的困境。由于本体能够清晰地定义概念之间的语义关系,并能被机器所理解,所以本体被广泛应
随着计算机技术的飞速发展和地理信息系统在地图制图领域中的广泛应用,对数字环境下地图综合自动化的需要越来越紧迫。地图自动综合是地图学与GIS(Geographic information system)领域的一个难题。一些复杂地图综合算子,如移位、典型化等的自动化程度仍然较低。尽管国内外学者对地图综合移位算法进行了长期不懈的探索,但目前仍存在诸多问题没得到有效解决,突出表现为以下几个方面:(a)移位
随着航天遥感技术的迅速发展,航天遥感图像已经广泛应用于气象预报、资源普查、环境监测、防灾减灾以及军事侦察等多个领域,在国民生产生活、国防安全保障中发挥着重要作用。图像处理技术是推动航天遥感迅速发展的关键技术之一,是提高遥感数据有效性和可解译性的有效手段,遥感图像处理技术已经成为了遥感科学与技术领域研究的前沿和热点。文章对涉及航天遥感图像去除冗余数据的若干算法进行了研究,着重研究了减少遥感数据量的压
互操作性,关联要因多维,约束情景复杂。对业务系统的互操作能力实施准确的分析与度量是一个挑战性难题,但却是非常必要的。目前,互操作性的研究范围主要集中于互操作性的定义、数据层的互操作性以及元数据层的互操作性,而模型层的部分语义互操作以及互操作能力度量仍具有较大的创新研究空间。业界存在多种业务模型,模型的定义、描述、结构、功能以及支持工具都存在差异;同时,对于互操作性的研究,业界主要关注于同构模型的语
本文研究运算器抵御硬件故障注入攻击的结构,在现有工作基础上研究密码协处理器的关键部件大素数模算术运算器的可检测硬件注入攻击的ASIC结构设计问题,并对相应的结构做了性能优化.大数模算术器件是许多公钥密码算法(如RSA和ECC)的核心部件,也是其中最耗时的部件.一直以来,大数模运算的快速实现和安全性是密码学领域的两大研究热点.其中,大数模运算的快速实现有相当详尽的研究,研究者们开发了大量的技术和算法
在线协作编辑系统已然成为互联网个人用户和其他网站获取信息资料的-个重要来源,对此类信息源的参考和引用已经成为一种普遍趋势,并且这一趋势还在迅速而广泛地传播着。然而,由于在线协作编辑系统的开放性和包容性,其中的信息的生成模式是动态而善变的,因此很容易受到用户编辑行为的影响而降低其信息可靠性。考虑到在线协作编辑系统的信息质量和用户的编辑行为之间存在着极为密切的联系,越来越多的研究者开始关注用户行为模式
随着信息化的加速和通信技术的发展,以互联网络为依托的信息服务产业呈爆炸式增长,数据服务的规模在各应用领域内呈指数上扬。面对数据量的不断增加,数据服务需要向低成本、高性能和大容量的云计算平台服务模式发展。而将数据服务置于云环境下,交由云服务提供商管理,服务数据存储在用户不可控的云端,其安全性便成为人们首要关心的问题。因此,对云环境下数据服务的安全性进行研究具有重要意义。在分析和总结云环境安全现状的基
近年来,随着新一代SAR系统投入运行,高分辨率SAR数据资源日益丰富。高分辨率SAR影像中建筑等大型人工地物的细节清晰可见。但是,由于SAR传感器独有的侧视成像机理,城市场景下高分辨率SAR图像中的建筑物往往互相遮挡,引起了明显的多次散射、叠掩等现象,导致地物目标解译难度加大。SAR层析成像作为一种真正的三维技术,可以估算叠掩在同一像元内的多个散射体目标,实现对沿高程向分布散射体的直接测量,获得高