基于类锥非负矩阵分解的人脸识别算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:freeangel01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物特征识别技术是利用人固有的生理特征和行为特征进行个人身份识别的技术,已成为应用数学和信息技术领域非常活跃的研究方向.人脸识别是生物特征识别的一种形式,其需要在计算机的辅助下进行,并具有非接触性和非强制性等优点.人脸识别的关键在于提取人脸图像中的特征信息,非负矩阵分解(NMF)是一种有效的图像数据特征提取方法,其能够提取人脸图像中有意义的非负特征信息.但是传统的非负矩阵分解算法没有充分的利用样本的类别信息,其在识别或者聚类任务中达不到理想的效果.不少学者提出了基于NMF的改进算法,例如最小容量约束非负矩阵分解(MVCNMF)和大锥非负矩阵分解(LCNMF)方法等.这些方法的目的在于对基图像矩阵进行约束,使得数据样本点落入到更合适的锥体当中.然而这些方法依然都存在着一些问题:(1)大锥非负矩阵分解的分类性能确实比非负矩阵分解的分类性能要好,但是其算法缺少理论上的收敛性证明.(2)大锥非负矩阵分解和最小容量约束非负矩阵分解都没有利用训练样本的类别信息,因而它们在分类任务中的性能会受到影响.(3)大锥非负矩阵分解和最小容量约束非负矩阵分解方法均是线性特征表达方法,它们在处理人脸图像非线性问题时性能会降低.为了解决这些问题,本学位论文对基于锥体正则项约束的非负矩阵分解的人脸识别算法进行了深入研究,取得了如下三个方面的研究成果:1.针对现有锥非负矩阵分解算法的无监督学习问题,本论文提出了一种利用样本类锥信息的非负矩阵分解算法,即类锥非负矩阵分解(CCNMF)算法.该算法首先建立了带类锥信息正则项的目标函数,其中包含了锥体容量和类间锥体散度等信息.通过最小化目标函数可以使得锥体容量更小而不同类别的锥体分得更开.这些性质使我们提出的CCNMF算法具有更好的分类能力.通过使用KKT条件求解目标函数的两个凸子优化问题,得到了CCNMF算法的迭代公式.进一步从理论上构建了目标函数的辅助函数,并证明了CCNMF算法是收敛的.最后在ORL、CMU-PIE、AR公开的人脸数据库中进行人脸识别实验,实验结果表明CCNMF算法具有较强的分类性能.2.为进一步提高类锥非负矩阵分解算法的性能,本论文提出了具有稀疏鲁棒性的类锥非负矩阵分解(RSCCNMF)算法.RSCCNMF算法使用了L2,1-范数作为损失函数同时在损失函数之后加入了类锥正则项和对特征矩阵的稀疏约束.L2,1-范数和F-范数度量相比好处在于,L2,1-范数不会放大数据噪声和离群值点的数值,从而使得RSCCNMF算法具有更强的鲁棒性.在理论上构建了目标函数的辅助函数,通过求解辅助函数的稳定点得到了RSCCNMF算法的迭代公式,由辅助函数的性质表明RSCCNMF算法是收敛性的.我们选择在ORL和Yale人脸数据库上进行有噪声和无噪声实验.噪声实验结果表明RSCCNMF算法具有更好的鲁棒性.无噪声实验结果显示出RSCCNMF算法取得了较好的识别精度.3.为解决锥非负矩阵分解相关方法的非线性问题,论文最后提出了一种非线性非负矩阵分解算法,即核类锥非负矩阵分解(KCCNMF).该方法是在核空间中对非线性映射后的训练样本矩阵进行非负矩阵分解.KCCNMF方法首先建立F-范数意义下的损失函数,并使用核类锥正则项进行约束,构成新的目标函数.使用KKT条件求解目标函数中两个凸子优化问题得到了KCCNMF的迭代公式.通过辅助函数法证明了KCCNMF算法的收敛性.最后在PE、CCVGA、CMU-face等人脸数据库中验证了KCCNMF算法具有更好的识别性能.
其他文献
股票市场作为社会经济的重要组成部分,为我国的经济发展发挥着重要的作用。投资者可以通过准确的价格走势预测,降低投资决策的风险。然而由于股票数据的非线性和非平稳特性,股票价格走势的准确预测往往非常困难。当前基于神经网络的深度学习算法(LSTM),在股票价格预测中初步显示重要的算法优势。然而在训练过程中,仅仅采用梯度下降算法进行网络优化,预测的准确性有待提高。进化算法作为一种鲁棒性强全局寻优算法,可以用
物流行业发展面临着激烈的市场竞争压力和消费者服务要求不断升级的挑战。物流企业要在如此激烈的竞争环境中生存,提高企业的核心竞争力,物流车辆路径规划是物流管理中的关键环节之一,优化物流车辆路径规划对于减少运营成本和提高服务质量至关重要。由于车辆路径规划问题属于组合优化的NP难问题,该问题的求解存在诸多的困难,如算法的收敛速度慢,求解目标过多,问题约束苛刻等。为了平衡问题求解的时空复杂度,本文基于演化计
动态多目标优化问题无论在科学研究还是在实际应用中都广泛存在。此类问题不仅具有多目标优化问题的基本特征,主要表现在多个目标互相冲突无法同时达到最优,而且这些目标还会随着时间的变化而发生改变,如目标函数、目标函数的数目和限制条件都可能会随时间变化。这些动态变化可能引起问题的帕累托最优前沿(Pareto optimal front,PF)和帕累托最优解集(Pareto optimal set,PS)随着
卷积神经网络(Convolutional Neural Network,CNN)已经被广泛地应用在许多人工智能平台中。但是,由于卷积神经网络的推理过程涉及大量的数据迁移以及复杂的数据计算,它们仍然很少被部署在移动或边缘平台上。新兴的神经架构(Neuromorphic Architecture)旨在结合存内计算技术(Processing In Memory,PIM)来减少数据迁移,它采用三维堆叠的形
特征提取是数据分析中的核心步骤之一.如何从海量的数据中提取其有用信息已成为目前应用数学与模式识别领域的一个热点问题.常用的特征提取方法包括主成分分析(PCA)、线性判别分析(LDA)、局部保持投影算(LPP)和非负矩阵分解(NMF).其中,非负矩阵分解(NMF)是主要针对非负数据的一种特征提取方法,其在人脸识别、聚类及高光谱分解等方面有着广泛的应用.然而,传统NMF还存在一些问题,比如没有充分利用
在现实工程问题中,多目标优化问题(MOPs)是一类非常常见的优化问题。多目标优化问题通常包含两个或两个以上相互冲突的目标。近年来,一系列针对不同类型多目标优化问题的多目标智能优化算法相继提出。然而,对于一些具有复杂的Pareto最优解集或最优端面的复杂多目标优化问题,它们的Pareto最优端面不同部分具有不同的收敛难度或者逼近的困难。因此,这类复杂多目标优化问题能有效地检验多目标智能算法的种群多样
目前,移动机器人的定位系统及算法在室内环境中已经取得了较好的定位效果,但是这些系统及算法在室外运行时会由于室外非结构化的环境、噪声和光照等各种因素的影响而无法很好地运行,因此室外移动机器人的定位仍然存在着许多问题亟待解决。本文主要研究使用视觉的传感数据在室外环境下移动机器人的定位问题,主要的研究内容如下:首先,针对移动机器人的定位问题,本文主要利用的是贝叶斯滤波的框架,已知贝叶斯滤波主要是通过运动
互联网技术发展迅速,网络文本信息激增。信息传播迅速而广泛,对社会有着重大的影响,因此高效地分析和处理文本信息变得尤为重要。文本分类是处理文本信息的关键技术之一,它可以帮助企业等各种机构有效地组织信息。因此,文本分类技术的研究在社会应用中具有重要意义。在文本分类技术中被广泛使用的循环神经网络(Recurrent Neural Network,RNN),由于其有时间方向的传播和层与层之间的传播的两个维
近年来在国家优惠政策的支持和计算机视觉技术的发展,安防监控及计算机视觉相关产业快速发展,政府、公共场所、火车站、企业、城市、区民小区都跟随国家的政策和计算机视觉产业的需求,加入到安防产业的研究和落地,由于智慧城市和大数据城市的打造,安防相关产业一直保持高增长态势。随着人工智能和计算机视觉技术的发展,人脸、行人、车牌等成为了重要的监控对象。在大数据的不断发展,人脸检索算法需要消耗大量的检索时间,同时
机动目标跟踪无论在军用还是民用领域皆有广大的应用需求与实际意义,也一直是热点研究方向。在众多机动目标跟踪算法中,交互式多模型(Interacting Multiple Model,IMM)是应用最广泛的一种算法。然而,传统IMM算法在跟踪机动目标时,往往会出现模型库庞大导致计算量剧增、模型库难完全匹配目标运动状态的问题。针对上述问题,本论文基于模糊信息处理原理,引入目标模糊语义信息,重点研究基于特