基于流形学习的有监督降维方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mm74481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科学技术的发展,高维大规模的数据大量涌现,这些数据往往是具有非线性分布结构,如何从这些数据中提取有效的信息,显得尤其重要。因此数据降维成为模式识别中必不可少的步骤。然而传统的降维方法往往无法有效的探寻此类数据中的非线性结构。流形学习方法的局部线性和全局非线性的假设,并且在低维空间中能保持这些结构,从而流形学习方法能有效地探测数据内部的非线性结构,是数据降维和特征提取的一个研究热点。本文中我们主要是讨论使用流形学习方法来进行模式的降维问题,针对传统的流行学习方法没有利用标签信息的缺点,提出了两种基于流形学习的有监督的维数约简方法,并将这些方法应用于人脸数据、肿瘤数据的分类预测问题中,并取得了较好的分类结果。全文的主要内容概括如下:1)介绍了维数约简中特征选择和特征提取两种主要方法。特征提取是通过线性变换或非线性变换来提取需要的特征,这个过程有新的特征出现;特征选择是从原来特征集中选择需要的特征子集。此外,从四个方面分别介绍了现有的几种典型的流形学习算法及其代表:投影法、生成法、嵌入法、公有信息法。2)介绍三种具有代表性的基于流形学习的监督降维方法:判别的局部线性嵌入(DLLE),局部敏感判别分析(LSDA),边缘菲舍分析(MFA)。进一步介绍了这些算法的线性化,核化,张量化技术来处理样本外点问题。最后分析了图嵌入框架与传统的降维算法之间的联系。3)针对现行的基于流形学习的降维方法的缺点,提出基于流形学习的正交判别投影算法。该算法充分考虑了具有类别关系的邻域非邻域信息,同时根据这个信息使用不同的函数来定义它们之间的距离。最后我们在人脸数据,癌症基因数据,神经胶质癌症基因数据的分类中验证了该算法的有效性。4)提出一种基于流形学习的敏感边界的判别投影算法。该算法借鉴SVM算法思想,充分分析训练样本集的类别信息和分布信息来构造一个投影矩阵,该投影矩阵融合了局部信息和全局信息,使得投影后的样本点能够很好的分类。最后通过实验验证了该算法的有效性。
其他文献
传统过程控制系统中的有线解决方案经常会带来成本高、布线困难、甚至某些场合无法应用等诸多问题。为此,本文针对过程控制的特点,提出了一种基于无线传感器网络的无线解决方
电力线通信(PLC)以其自身的优势,已经引起越来越广泛的关注。但是电力线信道上存在各种噪声、衰减和多径传播等问题,在这种网络上实现可靠、安全的通信是相当困难的。正交频分复
碳氧比测井是目前国内外广泛应用的套管井剩余油评价技术,但其测量中子产生的伽马射线的范围只集中在高能区部分,不能充分利用中子的反应过程中低能部分。本文充分分析了脉冲
电压源型逆变器馈电的永磁同步电动机驱动系统因其具有结构紧凑、可靠性好、功率密度高等优点,被广泛应用于航空、牵引等诸多工业领域。模型预测控制是产生于工业过程控制中的一种在线优化控制算法,其在处理非线性系统复杂约束优化问题时展现出极大的优势。近年来,由于模型预测控制具有动态响应快、目标函数配置灵活、易于处理约束优化问题等优点,被广泛应用于电气驱动领域。但本文通过研究分析发现,备选电压矢量个数有限和占空
随机因素、时滞现象和不确定性在很多实际系统中是普遍存在的,它们的存在使得系统的分析与综合变得更加复杂和困难,通常也是导致系统不稳定和系统动态性能变差的根源。不确定
网络流量监测是流量工程的一个重要内容,通过流量监测获得各种流量的统计信息是网络管理、网络服务分析、安全和错误监测、网络计费等应用和研究的基础。   到目前为止,国内
在一些对无功补偿实时性要求比较高的行业,如汽车焊接、造船焊接等电焊比较多的行业,电焊机负荷变化极为快速,并且引发大量的无功功率,这种电焊机冲击性负荷大量接入电网严重影响电网供电质量,经常产生较大的电压波动、电压闪变,导致电焊质量差并影响焊接的效率。应用动态无功补偿控制器实时补偿点焊引起的无功功率,将具有十分重要的意义。JKF系列分相低压动态无功补偿控制器是一种快速补偿无功功率的智能仪表,能够在少于
专家系统是人工智能中最重要的也是最活跃的一个应用领域,它实现了人工智能从理论研究走向实际应用,从一般推理策略探讨转向运用专门知识的重大突破。但是专家系统的设计与开发
运动目标检测与跟踪是计算机视觉的核心课题之一,它融合了图像处理、模式识别、人工智能、自动控制等相关领域的研究成果,在视频监控、机器人导航、视频传输、视频检索、医学
在能源危机和环境污染日益严重的今天,新能源的开发和利用越来越受到重视,太阳能以取之不尽、用之不竭、无污染等诸多优点越来越受到世界各国的青睐。而光伏并网发电最能代表太