基于局部插值嵌入的流形分类算法研究及应用

来源 :扬州大学 | 被引量 : 0次 | 上传用户:x360791581
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘在各行业中的逐渐运用,分类技术作为数据挖掘的一种重要手段也随之被许多研究者所重视。然而,由于数据的数量和复杂度急剧提升,对数据的分类难度也呈指数增加。如果直接将高维数据进行处理,将导致维数灾难的产生。流形学习是一种解决维数灾难问题的有效方法。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律,但是流形学习的结果并不一定利于分类处理,因为它的目的只在于降维,并不是以分类为目的。局部插值嵌入算法是一种优秀的流形降维算法,它对于嵌入在高维输入空间的低维流形,通过获得样本点邻域在切空间上投影的局部坐标,在通过样条函数的嵌入将局部坐标映射成为全局低维坐标,尽量减少样本数据在映射过程中的映射误差,这样能够极大地保持样本数据的局部特性。但是,局部插值嵌入算法同样囿于流形学习无法直接应用于分类问题的局限性,无法利用已有的标签信息并用以增强降维结果的可判别性,因此,我们有必要对局部插值嵌入算法进行改进使之可运用于高维数据的分类操作。本文着重研究了流形分类算法问题,研究了三种基于局部插值嵌入的流形分类算法,并进行了简单的应用。具体研究成果如下:(1)本文提出了一种基于局部插值嵌入的监督式的流形分类算法,结合线性判别分析的特点,利用已知的标签信息,最大化类间离散度的同时最小化类内离散度,并将局部插值嵌入的目标函数作为正则项用于局部数据结构信息的保持,并通过求取的最佳映射,对测试数据集进行数据扩展。(2)本文提出了基于局部插值嵌入的线性分类算法,利用训练数据的监督信息,分别构建类内图和类间图选择邻域,最大化利用训练数据的信息,根据所选择的邻域分别构建切空间,然后将切空间的坐标点映射至全局低维坐标,这时就可以计算获得最佳的线性映射,最后,根据这个线性映射完成对测试数据的扩展。(3)本文提出了基于局部插值嵌入的非线性分类算法,根据之前提出的线性算法,通过核函数改造为适用于非线性数据的方法。将原本的寻找最佳线性映射转变为使用核技巧寻找训练数据的非线性嵌入,并同样使用核技巧对测试数据推导其扩展形式,获得测试数据在低维目标流形中的非线性嵌入,从而具有更好的泛化性能,能够更好的应用于处理真实数据的分类问题。(4)本文设计了一种针对医学数据的分类系统,在此系统中应用本文提出的流形分类算法来处理医学数据。本系统主要功能包括三个部分:医学数据处理、结果显示、医学数据的管理。
其他文献
随着计算机信息技术和网络通讯技术的快速发展,基于组织机构代码基础信息数据库的各类应用如雨后春笋般涌现,在海关、银行、税务、统计等领域得到广泛应用,并取得了良好的社
当今时代,信息技术化迅速崛起,引领着世界科技的发展。而信息化办公,利用当(?)科技的优势,及时的报备数据,可以避免数据的重复提交,有效的弥补了人工管理的(?)所以大多数商家
快速城镇化以来,在中国城乡空间格局中,位于大都市郊区的乡村,其乡村问题最为严峻与尖锐。大西安作为中国西北地区最大的都市区,其中的城郊乡村面对着复杂而多变的城乡环境,
电力线通信技术在智能电网的发展中起到了非常重要的作用,电力线系统因为有遍布极为广泛的基础设施,可以使传输的数据依托现有的电力线输电网络传输到世界的每一个角落,大大
近年来,Janus纳米复合粒子因其形貌、组分、性能的不对称性,在固体表面活性剂、催化、自驱动马达、生物医学等领域具有广阔的应用前景,受到研究者的广泛关注。但是由于其制备过程涉及热力学和动力学两个因素,其结构很难精确调控,特别是合成具有可功能化的Janus纳米复合粒子仍处于探索阶段。因此,如何可控的设计并合成Janus纳米复合粒子,深入理解其形成机理,并拓展其功能性,以最终实现其高效可控制备和实际应
空气源热泵节能环保且适用范围广,作为建筑冷热源被广泛应用在我国大江南北,但使用过程中结霜是影响机组运行效果的首要因素,故各地都纷纷展开空气源热泵结除霜问题的研究。南北方室外环境温湿度差异较大,机组极易存在长江以南的有霜不除及北方的无霜除霜的误除霜现象,空气源热泵结霜及误除霜现象严重影响机组制热效果。本文针对贵阳中低温高湿的典型温度环境特征引起的空气源热泵结霜问题进行理论模型和实验研究分析,分析机组
实现机器与人类的自然交流,是人们一直以来的梦想。在过去50年里,语音识别技术的研究取得了巨大的进展,尤其是2011年以来,深度学习理论的完善、计算机性能的大幅度提升以及海
随着网络技术的飞速进步,互联网技术让人们的生活发生了翻天覆地的变化,但同时也让人们陷入网络安全问题的困扰。通过传统的加密方法,如替代密码等可以解决通信过程中通信双
触觉再现技术可提供更为自然真实的交互体验,将人类与虚拟世界的交流推向三维视听与触觉结合的崭新阶段。基于静电力的触觉再现技术可实现裸指触摸终端设备感知视觉对象形状
云计算用”pay-as-you-use”的方式以相对低的价格来提供强大的运算能力和可扩展的存储服务,越来越多的用户为了解决终端计算和存储的有限性问题,将大量的商业数据和个人信息