高维大数据的局部非线性嵌入降维方法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:whj0631
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和广泛应用,在很多领域产生了大量的高维数据,直接分析和使用这些高维数据是非常困难的事情,数据降维能够在很大程度上解决这一类困难。局部线性嵌入(LLE)是一种非线性的降维算法,自2000年提出以来,已经成为一个研究热点。LLE能够发现高维数据中隐藏着的低维结构,并且具有较低的计算复杂度,然而,LLE要求数据点在局部具有线性关系,这在现实世界中是难以满足的,现实世界中的数据常常带有噪声,或者是稀疏的,此时局部线性关系很容易被破坏,因而导致LLE的效果不够理想。本文在LLE的基础上,提出局部非线性嵌入(LNE)算法。LNE是LLE的推广和完善,不仅具备LLE复杂度低等优点,而且扩展了LLE的应用范围,其主要思想是,如果数据的局部不满足线性关系,就保持某种非线性关系,这种非线性关系通过对每个点的近邻点施加映射来实现。我们也可以从另一方面来理解LNE,给每个点的近邻点施加映射后,这些点变成了一个新的点,而在新的点之间,局部的线性关系正好满足。与LLE的各种改进算法相比,LNE有两个明显的优势:(1)没有引入多余的参数,实现起来更加的方便;(2)应用范围更广泛,能在噪声数据,稀疏数据以及其他一些结构复杂的数据上使用且结果优异。LNE算法的一个巨大困难在于如何选择合适的映射。在本文中,基于反复实验,我们给出了一类可用的映射,并总结出了映射所应该满足的必要条件。同时,我们对LNE做了相关的理论分析,在一定程度上解释了LNE适用于噪声数据集的原因。最后,使用实验在多个数据集,包括S形曲面,Swiss roll曲面,Swiss roll曲面的变体以及MNIST手写体数字上验证了提出算法的有效性,这为实际的高维大数据降维提供了一种新的思路。
其他文献
专业教师实践能力提升的途径不外乎校外培训、校内培训和自我提升,不同学校和不同教师有各自的实现方法。但从整体上看,院本执行机制是实现专业教师实践能力提升的关键,一个
思想政治理论课教学模式改革是提高大学生思想政治教育实效性的重要举措。必须以提高学生的思想政治素质和道德素质为教育根本,创新教师教育理念,把握学生的思想道德状况和需求
AXISP56系列产品为价格极具竞争力的高性能高清PTZ快球型网络摄像机,适用于零售和城市监控应用.该系列的顶级机型能够满足用户对于PTZ摄像机的所有主要需求,包括机械性能强大
东庄水利工程作为陕西重要的能源战略措施之一,在缓解泾、渭河流域水资源供需矛盾,减缓泾、渭河河道泥沙淤积,给当地带来经济效益的同时,引起了大坝阻隔鱼类回游、河道生态需
通过本次调研,深入了解视频监控系统运维现状,总结视频监控系统运维中所面临的问题,提出具体可实施的建议并合理给予视频监控系统的评估指标,分为视频监控系统硬件设备可靠性评估
小学是孩子成长过程中的一个转折点,而且是养成良好学习习惯的最佳时期,然而,很多孩子刚刚步入小学的大门,却表现出了逃避甚至厌恶上学的倾向。作为从事低年级班主任多年的小学教
目的探讨肾上腺骨髓脂肪瘤的CT表现特征及鉴别要点.方法收集经临床、CT诊断肾上腺骨髓脂肪瘤9例,其中7例手术和病理确诊.结果 9例骨髓脂肪瘤中7例明确定位、定性诊断,1例误诊
<正>《第一财经周刊》颁布了"2015中国商业创新50人"评选结果。富士施乐大中华区总裁徐正刚先生凭借积极倡导"CSR即是经营管理",坚持推行贯穿整体价值链的CSR举措,被评为"中
生活中,许多家长经常抱怨自己的孩子性格有缺陷,有的任性固执、脾气暴躁,有的孤僻内向、胆小怕事,有的粗心大意、马马虎虎。在寻找性格形成的各种原因时,估计很少有人会考虑
目的应用同轴轮廓成像原理对大白鼠离体肝脏、肺脏进行X线相衬成像实验,并与常规X线技术对比,为进一步实验奠定基础.方法在北京正负电子对撞机国家实验室,利用同步辐射装置的