论文部分内容阅读
随着现代科学技术的飞速发展,人们获取大数据量、高维数、非结构化的数据变得越来越容易,这就使得现代计算对高维非线性数据降维需求的增加,流形学习方法研究得到广泛的重视,研究也都取得了丰硕的成果,应用领域越来越广泛。局部线性嵌入(Locally Linear Embedding,LLE)方法是应用最广泛的一种流形学习方法,本文将深入分析LLE方法的机理。LLE方法的核心思想是在降维映射前后保持源数据的局部近邻性质。LLE方法认为高维信息一般存在于一个低维流形上,高维数据是由线性数据的非线性组合而成,主要针对非线性降维问题。
虽然LLE算法思想简单、易于理解,能够有效地学习出体现数据集低维流形结构的整体嵌入坐标。但是,LLE算法却存在这样一个缺点,即在样本数据稀疏的情况下,不能有效的对高维样本数据进行降维,而在实际应用中由于设备、条件等多方面的原因很难得到完备的数据集,这就构成了LLE算法的一个应用瓶颈。本文在深入分析算法失效的主要原因的基础之上,通过论证认为,LLE算法忽略了目标嵌入空间内的数据在计算表示坐标中的作用,从而导致其处理稀疏源数据时失效。为解决这一问题,作者提出了两种基于局部映射理论的LLE算法的改进算法,即基于局部映射的线性嵌入算法(LMLE)和基于局部映射系数最小的算法(CMLM)。为验证这两个方法的有效性,对LLE算法应用中最常用的S曲线,通过稀疏采样模拟源数据稀疏的情况,将LMLE方法、CMLM方法与传统LLE方法的处理结果进行比较,验证算法在源数据稀疏情况下也能取得较好的降维结果。同时用LMLE方法、CMLM方法对一组人工脸模数据和一组真实人脸数据进行实验,展示了算法的适用性和它在人脸数据处理中的应用前景。
空间信息处理与应用是目前最热门的研究课题之一,但由于空间数据是一种高维数、高复杂度的、常常包含大量噪音的数据源,如何有效的提取其中最有效、最本质的信息一直是研究人员非常感兴趣的一个问题。数字摄影测量作为空间信息处理与应用的数据来源之一,自然成为研究人员关注的焦点之一。作者在分析、理解空间数据信息源自身特性的基础上,将LMLE方法和CMLM方法应用于航空图片降维处理,在降维结果的基础上实现影像的匹配。