基于局部映射的流形学习及应用

来源 :中国科学院研究生院(本部) 中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:xp108999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的飞速发展,人们获取大数据量、高维数、非结构化的数据变得越来越容易,这就使得现代计算对高维非线性数据降维需求的增加,流形学习方法研究得到广泛的重视,研究也都取得了丰硕的成果,应用领域越来越广泛。局部线性嵌入(Locally Linear Embedding,LLE)方法是应用最广泛的一种流形学习方法,本文将深入分析LLE方法的机理。LLE方法的核心思想是在降维映射前后保持源数据的局部近邻性质。LLE方法认为高维信息一般存在于一个低维流形上,高维数据是由线性数据的非线性组合而成,主要针对非线性降维问题。   虽然LLE算法思想简单、易于理解,能够有效地学习出体现数据集低维流形结构的整体嵌入坐标。但是,LLE算法却存在这样一个缺点,即在样本数据稀疏的情况下,不能有效的对高维样本数据进行降维,而在实际应用中由于设备、条件等多方面的原因很难得到完备的数据集,这就构成了LLE算法的一个应用瓶颈。本文在深入分析算法失效的主要原因的基础之上,通过论证认为,LLE算法忽略了目标嵌入空间内的数据在计算表示坐标中的作用,从而导致其处理稀疏源数据时失效。为解决这一问题,作者提出了两种基于局部映射理论的LLE算法的改进算法,即基于局部映射的线性嵌入算法(LMLE)和基于局部映射系数最小的算法(CMLM)。为验证这两个方法的有效性,对LLE算法应用中最常用的S曲线,通过稀疏采样模拟源数据稀疏的情况,将LMLE方法、CMLM方法与传统LLE方法的处理结果进行比较,验证算法在源数据稀疏情况下也能取得较好的降维结果。同时用LMLE方法、CMLM方法对一组人工脸模数据和一组真实人脸数据进行实验,展示了算法的适用性和它在人脸数据处理中的应用前景。   空间信息处理与应用是目前最热门的研究课题之一,但由于空间数据是一种高维数、高复杂度的、常常包含大量噪音的数据源,如何有效的提取其中最有效、最本质的信息一直是研究人员非常感兴趣的一个问题。数字摄影测量作为空间信息处理与应用的数据来源之一,自然成为研究人员关注的焦点之一。作者在分析、理解空间数据信息源自身特性的基础上,将LMLE方法和CMLM方法应用于航空图片降维处理,在降维结果的基础上实现影像的匹配。
其他文献
随着计算机网络及通信技术的发展,在面向企业的信息系统发展过程中,工作流管理系统WfMS(Workflow Management System)逐渐从信息系统中独立出来,作为一个通用支撑工具提供给应用
协议评估是网络协议设计开发过程中的重要环节,直接影响到网络协议设计开发的质量和效率。模拟、仿真和实景实验是三种主要的协议评估途径,仿真在半真实网络上运行真实代码,它结
长期以来,用户界面(User Interface)的开发一直是最耗费时间的一项工作,因此研究者一直希望通过UI复用的方法来降低开发成本。通常情况下研究者采用UI组件技术并以组件协同的方
随着Internet的发展,越来越多的企业应用采用基于J2EE标准构建的多层结构的Web应用系统。与传统的采用EJB组件构建Web系统相比,Spring框架在面向接口编程、易于测试、可维护性
故障诊断技术是借助于现代监控、测试和计算机分析等手段,诊断其故障的性质和起因,并预测故障趋势,进而确定必要的对策。利用故障诊断技术可以及时找出设备的故障,避免不必要的损
基于TCP/IP的Internet迅猛发展,已经成为全球覆盖范围最广,承载业务最多的综合性网络。通过IP网络承载传真业务,由于其低廉的费用和高效的带宽利用率,正在成为一种新的具有相
随着互联网的高速发展,Web上的信息量高速增长,这其中文本信息占据了相当重要的位置。对这些文本信息加以搜集、分类和总结,传统的手工方法已经无法满足需要。文本自动分类、信
随着互联网的迅速发展,计算机之间的交互不断增强,软件的安全问题已成为计算机系统安全的一个至关重要的问题。程序安全作为软件安全问题的一个子问题是目前研究的热点之一。已
知识经济和信息时代飞速发展的今天,世界经济的全球化和国际化推动着经济体制的改革,在经济发展的浪潮中,出版行业也在发生深刻的变化,出版逐步由微观管理向宏观管理过渡。 为
学位