基于多层非负矩阵分解架构的人脸识别若干算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:6ri
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,人工智能成为了我们日常生活的焦点。在人工智能时代,人脸识别技术被广泛用于我们的日常生活中,如智能手机的人脸解锁功能以及人脸支付功能等,因此人脸识别技术识别性能的提升成为相关研究人员的研究热点。为此,一些先进的人脸识别算法被相继提出并得到了广泛的运用,如非负矩阵分解算法(NMF)等。NMF算法的基本思想是用一组基图像的线性组合来表示原始图像,这种对原始图像进行分解的方法符合人类思维中“局部构成整体”的思想。由于拍摄环境,设备,拍摄角度以及人脸遮挡等情况的不同,人脸照片会出现较大差异,数据呈现非线性分布。NMF作为一种线性算法,在处理较为复杂的非线性数据分布问题上有较大困难,且浅层的NMF算法学习所得的基图像和特征是较为浅显的,不能体现出数据更深层次的特征,而人类视觉系统在分析图像时是采用分层的、非线性的方法。本学位论文旨在解决上述算法存在的不足之处。论文分为五章进行,第一章主要介绍人脸识别和NMF发展现状、NMF和多层NMF的分解思想以及论文的主要内容和组织架构,第五章为论文总结和展望。本学位论文的研究工作主要在第二章至第四章体现。以下内容将简要介绍这三章的主要研究工作。经典的NMF算法作为一种线性算法,在处理非线性数据分布时效果不佳。RBF神经网络是一种有效的非线性学习模型,在处理非线性数据分布问题上表现出很强的非线性拟合能力。隐藏神经元和权重在神经网络中起着重要的作用。第二章提出了基于径向基函数的非负矩阵分解(NMRBF)神经网络算法。NMRBF算法利用NMF的主要思想对RBF神经网络的参数进行训练。该算法能够提高隐藏神经元的准确性,权重的迭代公式可以保证它的可解性和可解释性。第二章实验将在ORL,Yale 2个人脸数据集上进行,实验结果表明了论文所提出的NMRBF神经网络算法具有良好的识别性能。但NMRBF算法仍是一种浅层的算法,很难提取数据更深层次的特征。为了能够提取反映样本深度局部化特性的特征,第三章构造了一种新颖的基于底层基图像学习的深度非负基矩阵分解架构。该架构通过对基图像的深度分解从而获取底层基图像矩阵,这样对基图像深度分解的架构可以理解为获得更能够反映样本局部特性的基的过程,该架构具有强烈的可解释性和实际的物理意义。为了实现该架构,本文首先提出深度非负基矩阵分解算法(DNBMF)和正则化深度非负基矩阵分解算法(RDNNBMF)。并从理论上证明了算法的收敛性。本章实验在FERET,ORL,AR,CMU,Stirling和Yale 6个公开人脸数据集上进行,实验结果显示了本章构造的基于底层基图像学习的深度非负基矩阵分解架构相对其他基于特征系数分解的深度分解架构相比具有较好的识别性能。但提出的两种算法是线性算法,在处理更加复杂的非线性分布数据时识别性能依旧有待提高。为了让深度非负基矩阵分解架构能够适应更多复杂数据模式识别问题,论文第四章又提出了一种非线性的深度非负基矩阵分解算法—正则化深度非线性非负基矩阵分解算法(RDNNBMF)。该算法将原始样本以及每层的基图像通过一个非线性映射投影到高维空间中,并在此高维空间中对映射样本进行基于底层基图像的深度分解。第四章实验在FERET,ORL,AR,CMU,Stirling和Yale 6个公开人脸数据集上进行,实验结果显示了本章提出的非线性算法RDNNBMF算法与线性算法DNBMF算法和RDNBMF算法以及其他非线性算法相比具有更好的识别性能。
其他文献
随着现代仿生机器人的研究深入,两栖仿生机器人因其强大的环境适应性备受关注。生物海蟹作为一种浅滩两栖生物,既可以水陆爬行,也可以水中游动,具备优越的两栖运动能力。本文工作在国家自然科学基金资助下开展,以海蟹为仿生对象,在实现两栖运动的前提下,融合水下滑翔功能,研制一台两栖仿生机械蟹样机。目前工作内容包括总体结构设计、水下滑翔系统研究、水下游动仿真以及样机实验。论文具体开展了以下研究工作:首先基于生物
偏振成像在材料识别、军事侦察和医学诊断等领域有着重要的应用价值,而拥有实时成像优势的分焦平面偏振成像是目前使用最广泛的偏振成像方式,但是由于自身的偏振阵列结构特点,分焦平面偏振传感器存在着固有的空间分辨率损失问题。为了解决这一问题,研究者们已经提出了一系列的超分辨重建方法,大致上可以分为基于插值的方法和基于机器学习的方法,基于插值的方法需要手工设计插值规则,且对于图像质量的提升存在难以跨越的瓶颈;
数字全息显微术是一种通过光的干涉记录物体波前并通过数值计算的方法在计算机中再现物体波前的定量相位测量技术,因其无需接触样品、重建速度快、测量精度高等优点,被广泛应用于细胞观测、表面形貌测量以及流体分析等领域。在数字全息显微术中,由“离轴光路结构”和“显微物镜”引入的相位畸变是影响其相位测量精度的重要因素,因而,“如何进行相位畸变补偿”也成为了数字全息显微术研究领域的一个重要而持久的话题。本文首先回
光纤气压传感器由于结构紧凑、制作简单、灵敏度高、抗电磁干扰等优点,被广泛的应用于环境监测和工业领域。而随着光子晶体光纤的发展,基于光子晶体光纤的传感器由于其有效模场面积大、单模传输范围宽、高双折射效应等诸多优良特性,逐渐的成为人们的研究热点。本文提出并制备了三种基于光子晶体光纤的气压传感器,测试了这些器件的气压传感特性,并对其温度和应力等串扰也进行了实验分析。本论文的主要内容如下:1、研究了几种常
通信网络的快速发展加速了物联网技术的应用进程,如今,智能家居、无人驾驶、智慧城市等正在逐步融入人们的日常生活,为人们带来更多的便利。物联网作为新兴产物,体系结构更复杂、没有统一标准,各方面的安全问题更加突出。其关键实现技术是传感网络。在传感器暴露的自然环境下,如何长期维持网络的完整性成为了传感技术发展的新方向。光纤传感器因具有抗电磁干扰、耐绝缘、耐腐蚀、体积小质量轻、可接入网络进行远程监测等优异性
表面等离子体共振(Surface plamon resonance,SPR)是光与表面等离子体相互作用时发生的一种共振现象。SPR对介质周围的环境变化异常敏感,基于SPR的光学传感器由于其高灵敏度、免标记、实时、快速、在线检测等优点,已被广泛应用于生物医学、环境监测、食品安全等领域。然而提高SPR传感器的灵敏度和检测精度一直以来都是该领域研究的热点。近十多年以来,一些先进二维材料如石墨烯、过渡金属
基于微多普勒雷达的人类活动识别可用于许多领域,例如睡眠监测,老人护理,人机交互和反恐监测等等。但是现有的分类算法从雷达数据的表示方式、特征提取和分类识别分析仍然存在许多不足。到目前为止,几乎所有的分类算法对基于雷达的动作进行识别都先对原始数据进行短时傅里叶变换(short-time Fourier transform,STFT),原始的雷达数据就表示为频谱图。然后用手工的方式或者用神经网络对频谱图
光声成像作为一种新型的生物医学成像技术在近几十年迅速发展,相比较纯光学与声学成像,光声成像技术在成像深度和对比度方面展现出更大的优势。但是,大多数光声显微系统采用压电超声换能器进行光声信号检测,受压电材料固有物理属性的限制,这类探测器的探测带宽有限,通常在几十兆赫兹左右,无法准确响应短脉冲光声信号。这导致了成像系统纵向分辨率较低(通常大于20μm),难以准确定位吸光物质的深度位置。而且,在光学分辨
随着科技的快速发展,5G时代万物互联人工智能的来临,物联网感知技术得到大力提倡,光纤传感技术愈发得到重视。自光纤光栅问世几十年来制备方法越来越多,对于光纤布拉格光栅而言其制备方法就有:双光束干涉法,相位掩模板法,飞秒激光逐点/逐线法等,应用光纤布拉格光栅作为敏感器件的传感器也越来越广泛。本文提出了在特种光纤上制备光纤布拉格光栅(Fiber Bragg Grating;FBG),并将其作为检测外界环
偏光片,作为薄膜晶体管液晶显示面板(TFT-LCD)最重要的组成部件之一,其性能对液晶面板的质量有重要的影响。而偏光片外观缺陷会降低整个液晶面板的显示质量,甚至造成整个面板的报废。因此,研究偏光片外观缺陷视觉检测技术具有重要的意义。针对难以检测的细微透明压痕缺陷,本文提出了一种基于机器视觉的偏光片外观缺陷饱和成像检测方法,主要研究内容如下:1.研究了一种饱和度指导的极细微压痕缺陷图像增强方法。条纹