用于人脸识别的基于二维和三维图像的特征提取方法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:tapril10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别技术是指利用计算机分析人脸图像,从中提取出有效的识别信息,并用以辨认身份的一门技术。在过去的几十年中,人脸识别技术已经成为计算机视觉、模式识别和人工智能领域的一个研究热点。与其他生物特征识别技术相比,人脸识别技术具有自然性、方便性和非接触性等优点,这使其在安全监控、身份验证、人机交互等方面具有巨大的应用前景。虽然人类能毫不费力地识别出人脸,但利用计算机识别人脸却是一个难度极大的课题。它的困难性主要体现在:人脸不是一个纯粹的刚体,具有复杂而丰富的表情;人脸的模式会受到时间间隔、脸部遮挡物等因素的影响而具有多样性;在获取图像的过程中,光照条件、成像条件等因素是不确定的。这诸多因素使人脸识别成为一项极富挑战性的课题。  提高人脸识别性能的关键因素之一就是提取有效的人脸图像特征,因此主要研究了基于二维和三维人脸图像的特征提取方法。为了实现这两种特征提取方法并将其用于人脸识别,还涉及了人脸检测、脸部特征点定位、三维人脸图像的配准、三维人脸形态模型的建立、三维人脸形态模型的渲染以及三维人脸形态模型对二维人脸图像的拟合等问题。  用于人脸识别的特征提取算法仅仅需要提取人脸区域的特征,所以人脸检测是自动人脸识别系统的一个必要环节,其结果的准确性也会直接影响到特征提取的有效性。因此,采用了基于Adaboost学习算法的多姿态人脸检测方法,其中所采用的多级分类器结构和金字塔结构都大大提高了检测速度。实验结果表明该人脸检测方法是快速有效的。  为了归一化人脸图像的大小,提出基于快速辐射对称变换(fast radial symmetry transform)的双眼定位方法,首先利用快速辐射对称变换快速寻找特征点,并提出眉毛定位算法以缩小搜索双眼的区域,减少其它特征点对双眼定位的影响,再利用眼珠模板利双眼的几何特征即可准确地定位双眼。另外,根据双眼定位的结果初始化主动外观模型,采用基于主动外观模型的方法定位脸部特征点以提取人脸图像的局部特征。  基于二维人脸图像的特征提取方法仅仅利用了人脸图像的二维信息,与基于三维人脸图像的特征提取方法相比,该方法具有数据易采集、存储量小、计算量低和算法成熟等优势。主要提出三种基于二维人脸图像的特征提取方法:  是全局特征与局部特征相融合的方法。首先采用PCA(principal component analysis)方法提取人脸图像的全局特征;然后利用主动外观模型定位脸部特征点,并在其中17个特征点处提取Gabor小波变换系数,作为人脸图像的局部特征;最后在特征提取阶段或匹配度阶段将这两种特征进行融合。实验结果表明融合后的特征要比单一的全局特征或局部特征具有更好的识别性能。  二是判别性的局部映射(discriminative locality preserving projection,DLPP)算法。它利用了训练集的判别信息,对局部映射(locality preserving projection,LPP)算法进行了改进。LPP算法可以保持流型的局部结构,而DLPP算法不仅继承了这一优势,而且在不损失各类之间的本质差分的基础上,尽可能地减少样本的变换差分和噪声,使映射后的样本集的类内距离最小而类间距离最大,这使DLPP算法比LPP算法更有利于解决识别问题。  三是有监督的聚类嵌入(cluster preserving embedding)算法。它通过寻找类内的最小距离来保持聚类信息,使嵌入后的特征向量易于被分类。其中针对样本集的相异度矩阵采用常数变换嵌入(constant shift embedding)方法以得到样本集的特征向量,而利用径向基函数(radial basis function)神经网络,则可以快速得到新样本的特征向量。  由于二维人脸图像是人脸经过平面投影的结果,所以当人脸的姿态发生较大的变化时,投影得到的二维人脸图像也会有很大的差别,那么利用数量较少的二维人脸图像就很难得到人脸的本质特征。与二维人脸图像相比,三维人脸图像可以表现和存储更全面的人脸信息,因此,基于三维人脸图像的特征提取方法可以得到相对稳定的人脸特征。主要讨论了其中的基于三维人脸形态模型的特征提取方法,也就是首先利用三维激光扫描设备采集了60个人的60幅三维人脸图像;然后对所有图像进行预处理和配准,并对配准后的图像进行PCA得到三维人脸图像的子空间,即三维人脸形态模型;三维模型经过渲染后得到二维合成图像,其与二维输入人脸图像的拟合结果即可作为特征提取的结果。  在三维图像的配准部分,提出一种迭代最近邻点(iterative closest point,ICP)方法。其中提出一种对应点匹配算法,将对应点的匹配范围限制在半径很小的球内,使ICP算法能快速匹配对应点,并采用改进的M估计算法进行运动估计,以提高ICP算法的精度。  另外,提出一种用于三维人脸形态模型拟合的三角形采样策略。在拟合的每次迭代过程中,都需要在三维人脸形态模型上选择一定数量的三角形,在拟合的初始阶段,将三角形采样落在眼、鼻、口这三个区域内的概率设成大于落在脸颊、额头等其它区域的概率,随着拟合过程的推移,逐渐削弱这种优先级关系,最后同等对待各区域。由于人脸的主要特征集中在眼、鼻、口这三个区域,所以该策略可以加快拟合速度,提高拟合精度。
其他文献
肝脏是人体最大的腺体和代谢器官,同时也是机体重要的免疫器官。当各种致病因子作用于肝组织后,可引起肝细胞的损伤、再生、纤维化等,导致肝功能不全,甚至发展为肝功能衰竭。目前
学位
学位
数字图像信息隐藏是近年来提出的一种有关数字图像信息安全的新问题,它主要研究数字图像的隐藏、数字水印、以及攻击和抗攻击等,其目的是对数字图像进行隐蔽传输和安全存储。对
微操作机器人具有位移精度高、定位精准、操作精密等特点,能够协助或代替人将工作空间从宏观领域拓展到微观空间领域。目前,微操作机器人成为机器人研究领域的一个重要分支,得到
学位
学位
目标的自动识别是计算机视觉的一个基本问题,对一些重要的地面目标的自动识别在民用及国防中都有着重要的意义。而图像分割技术历来都是自动目标识别(ATR)乃至整个图像处理领
武器装备发展是一项复杂的系统工程。未来作战需求的不确定性、武器装备体系的复杂性、武器装备需求问题边界的模糊性、需求分析过程和方法的不确定性等问题,使得武器装备的需
学位