基于流形学习和协同表示的人脸识别算法研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:fanxingyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别具有大量的应用领域,包括安防、个人身份验证、互联网通信和电脑娱乐等。它作为一种主要的生物特征识别技术,变得越来越重要,在公共安全和国家安全等众多领域有着重大的应用价值。与其他生物特征识别方法相比,人脸识别拥有自然、友好和方便等优点,受到越来越多的研究者们的关注,并取得了大量的研究成果。但是,由于人脸结构的可塑多变性、人脸受到光照的影响以及人脸可能受到遮挡等原因,这使得人脸识别极具挑战性,值得继续深入研究。特征提取和特征降维是人脸识别中的两个关键步骤,如何有效地提取人脸特征是人脸识别的关键问题之一。目前,在人脸处于遮挡情况下,人脸识别效果还不够理想,要开发出具有鲁棒性和实时性的人脸识别系统需要解决好多的问题。现在的人脸识别通常需要每人多个训练样本才能获得较好的效果,但是在许多特定场所中只能获取一人一幅图像可以用来训练,而单训练样本的人脸识别效果不理想,如何解决单训练样本的人脸识别成为现实的问题。本文对人脸识别中的这些现实问题进行了深入的研究,并提出若干的人脸识别新算法。本文主要内容和贡献如下:1.提出了基于黎曼流形学习的人脸识别算法。等距映射(ISOMAP)只能应用于内在的平坦流形,局部线性嵌入(LLE)不能反映流形的全局结构。在任一点都定义有黎曼度量张量的微分流形称为黎曼流形,黎曼流形学习(RML)的基本思想是用低维空间的黎曼法坐标来表示高维流形中的点,实现维数约减的目的。实验结果表明,RML的识别率高于ISOMAP和LLE。2.提出了融合局部二值模式和保局投影的人脸识别算法。保局投影(LPP)是一种线性流形学习的降维算法,是对非线性的拉普拉斯特征映射(LE)的线性近似。LPP构建近邻图来对人脸空间的流形结构进行建模,然后寻找一组基图像。LPP是对人脸流形上拉普拉斯-贝特拉米算子特征函数的最优线性近似,反映人脸空间的本征流形结构,而且拥有清晰的变换矩阵,因此,LPP很适合于人脸识别。但是单纯地用LPP进行人脸识别,识别率并不高。局部二值模式(LBP)是一种灰度范围内的纹理描述方式,能有效地提取人脸局部结构的纹理特征,非常适合用于人脸特征描述和识别。本文将LBP和LPP相结合,提出了融合LBP和LPP的人脸识别算法,记为LBP-LPP,首先利用统一模式的LBP算子提取人脸特征,然后用LPP对人脸特征向量进行降维,最后用最近邻分类法进行分类和识别,可以获得很高的识别率。实验结果表明LBP-LPP的性能要比其他大部分算法要好。3.研究了融合Log-Gabor小波和判别保局投影的人脸识别算法。对于人脸识别来说,特征提取很重要。Gabor小波和Log-Gabor小波都是有效的人脸特征提取方法,但是Gabor小波存在缺点,而Log-Gabor小波恰好能弥补Gabor小波的缺点,表明Log-Gabor小波比Gabor小波更适合提取人脸特征。本文将Log-Gabor小波和判别保局投影(DLPP)相结合,提出了融合Log-Gabor小波和DLPP的人脸识别算法,记为LGDLPP。LGDLPP首先利用Log-Gabor小波提取人脸特征,然后用DLPP对人脸特征向量进行降维,最后用余弦相似分类器进行分类和识别,可以获得很高的识别率。实验结果表明LGDLPP的性能要比其他算法要好。4.研究了鲁棒协同表示在人脸识别中的应用。基于稀疏表示的分类(SRC)和鲁棒稀疏编码(RSC)都成功地用于鲁棒的人脸识别,对受遮挡的人脸识别都具有很强的鲁棒性,但是计算复杂度很高。研究发现是协同表示而不是1l范数约束使SRC适用于人脸识别,本文提出了基于鲁棒协同表示(RCR)的人脸识别算法。与RSC相似,用迭代重加权协同表示算法来解决RCR模型。RCR拥有RSC相似的识别率,但计算复杂度低很多。RCR和其他算法在AR和Extended Yale B人脸库上进行了实验比较,实验结果表明RCR的性能比其他算法要好。5.人脸识别需要每人多个训练样本才能获得较好的效果,但是在许多特定场所中只能获取一人一幅图像可以用来训练,针对于单训练样本人脸识别问题,基于协同表示的分类(CRC)的算法复杂度比扩展的基于稀疏表示的分类(ESRC)低,而CRC的识别率比ESRC低。结合两者的优点,本文提出了扩展的基于协同表示的分类(ECRC)用于单训练样本人脸识别,ECRC的基本思想是:某对象的人脸的类内变化可以近似表示成其他对象的人脸的类内变化的线性组合,和构造一个辅助类内变化字典来表示训练图像和测试图像的变化。实验结果表明,与CRC和ESRC相比,ECRC拥有高的识别率和低的算法复杂度。在ECRC的基础上,本文又提出了融合Gabor小波和ECRC(GECRC)的单训练样本人脸识别。GECRC先利用Gabor小波提取人脸特征,再用ECRC进行分类和识别。实验结果表明,GECRC的性能优越于其他算法。
其他文献
本文主要研究了一类整数序列的正则性,并将有限字符集上的代换和有限自动机的概念推广到了无穷字符集上.同时研究了无穷字符集上的代换和无穷状态自动机所生成序列的正则性.
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
成都武侯祠现存的清康熙十一年(1672)宋可发撰写的《重修忠武侯庙碑记》极具文献史料价值和书法艺术特色。在内容上,它具有独一无二的史料价值,记录了清初武侯祠建筑布局、文
图像局部不变特征是模式识别、图像处理、计算机视觉等领域核心研究内容之一。由于图像局部不变特征对模糊、尺度、视角、光照以及压缩等图像变换具有良好的不变性,众多学者
聚酰亚胺(PI)以其优异的耐热稳定性、化学稳定性及介电性能,在航空航天、微电子、光电工程、液晶显示、分离膜等领域得到广泛应用。传统PI显示棕色或棕黄色,限制了其在光电工
可伸缩性,按需付费以及基于网络的消息传递是云计算的三个核心特征。云计算强调一切皆服务。基础设施层、平台层以及面向最终用户的软件层都被包装为不同形式的服务,并通过不
通过对GFC系列反吹袋式除尘器本体配套工艺及设施的改造,增大处理能力,从而提高利用率,达到高炉炼铁生产增产不增污的要求。 Through the transformation of the supporting
随着计算机体系结构技术的深入发展和芯片制造工艺的不断进步,CPU微体系结构呈现出众核化、异构化的发展趋势,给传统并行编程模式带来新的挑战。而应用程序的多样化发展进一
要想在小学数学教学中适机渗透数形结合思想,提高学生的学习效率,一要创设以形助数情境,营造乐学氛围;二要设计以形助思活动,呈现有效学习;三要创设以形促思环节,拓展有序学
基于视频的运动目标检测与跟踪是计算机视觉和模式识别领域的研究热点,在智能监控、人机交互、视觉导航等方面有着重要的应用。但在实际应用场景中,由于受到复杂环境的干扰以