基于半监督流形学习的人脸识别算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:cc51wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为极具应用价值的生物特征识别技术,人脸识别有着无接触、快速及安全等优势,其也一直是模式识别的研究热点。但人脸图像中表情、姿态、光照度等内外在因素皆多变,使得该研究至今仍颇具挑战性。近些年来,越来越多地研究成果表明,人脸可视成一个嵌于高维空间中的低维流形,而高维数据中存在着一些由内在低维变量作用形成的流形,倘若我们可以获得控制这些变化因素的内在变量,就能挖掘出高维观测数据集中的低维流形表征,从而使得观测空间的维数极大地降低,不仅避免了“维数灾难”,而且对于识别准确率的提高往往有较大帮助。本文以流形学习为基础,主要研究了人脸识别中特征提取的两种算法,通过实验验证了它们的有效性。其主要研究工作和成果如下:1、详细分析了局部切空间排列、等距映射、拉普拉斯特征映射及局部线性嵌入这四种流形学习算法目的、原理及求解过程,对时间复杂度进行了估算,以此归纳出流形学习算法的统一框架。2、讨论了维数约简、线性化流形学习、监督流形学习及半监督流形学习等流形学习在人脸识别应用中遇到的一些关键问题,揭示了它们的区别与联系。3、提出了一种基于无监督鉴别投影(Unsupervised Discriminant Projection,UDP)的半监督流形学习人脸识别算法。该算法采用图像欧式距离(Image Euclidean Distance, IMDB)来选择各样本点的K近邻,由此得到修改后无监督判别投影中的邻接矩阵,并在传统的无监督判别投影中,利用非参数鉴别分析(Nonparametric Discriminant Analysis, NDA)融入类别标签信息获得几何最优投影,最后将经此投影方向后提取出的人脸特征信息作为分类样本。通过在人脸库上的大量比较实验,验证了该方法的准确性和有效性。与此同时,计算每两幅图像间的距离时采用的图像欧式距离也由数学推导和比较实验验证了其能够更好地反映人脸图像之间的差异。4、提出了一种基于邻域保持投影方法(Neighborhood Preserving Projections,NPP)的半监督流形学习人脸识别算法。首先针对人脸识别采用图像欧式距离(IMDB)来选择各样本点的K近邻,由此调整邻域保持投影中的重构权值矩阵,然后通过非参数鉴别分析融入类标签信息获取几何最优投影向量,最后通过对多姿态人脸库应用K阶最近邻(k-Nearest Neighbor, KNN)分类器进行比较实验,验证了该算法对人脸图像进行分类,能够获得较高的分类识别率。
其他文献
在因特网初期发展阶段,TCP/IP协议被设计为可保证报文的成功传输和按序投递,同时辅以重收敛技术用于当网络拓扑变化时确保路由的健壮性。在现实网络环境中,设备发生失效是不
光突发交换技术(OBS)汲取了较细粒度的光分组交换技术和较粗粒度的光电路交换技术的优点,克服了两种交换技术的缺点,是下一代光互联网核心支撑技术之一,并引起了众多学者的重视
学位
随着计算机网络技术和多媒体技术的高速发展,人们对信息的需求更加丰富,网络多媒体业务越来越受到人们的追捧,同时由于计算机性能的大幅提高,立体视频的应用业务也逐渐变成了
随着3G牌照的发放,TD-SCDMA的网络覆盖有大幅增加,截止2010年1月,我国TD-SCDMA现网已拥有10万个基站,中国移动今年TD-SCDMA基站建设规模将超过8万个,加上现网中的基站,基站总数将超
多输入多输出(MIMO)雷达具有多个发射天线阵元和多个接收天线阵元,每个阵元发射不同的信号且发射信号相互正交。由于信号具有正交性,在空间不会形成高增益的窄波束,而是形成
编码缓存是最近几年才提出的一种新的缓存技术,在性能上和传统缓存方案相比有着显著的提升。它除了带来本地缓存增益以外,还带来了额外的全局缓存增益,这种增益来源于对本地
随着二维图像获取、编码、传输与显示技术的日臻完善,自然景物的二维信息已经不能满足人类的需求,人类追求再现真实自然景物的下一个目标就是再现景物的三维信息。立体成像技
随着3G (the 3rd Generation)业务逐步在全球大规模部署,3GPP (3rd Generation Partnership Project)又启动了长期演进发展(Long Term Evolution,LTE)等长期标准演进项目以应
图像拼接最初是为解决摄像机局限而产生的一种技术,其利用图像的重叠区域获得图像之间的映射关系从而将多幅图像映射到同一坐标系,重叠区域相互覆盖,实现图像之间的拼接。该