论文部分内容阅读
随着信息技术的发展,同一对象可通过多特征或多源域数据描述,这样的数据被称为多视角数据。与单视角数据相比,多视角数据能够反映对象的不同特性,包含的信息更丰富。然而在许多实际应用中,多视角数据具有高维度的特性,直接使用多视角数据一方面存储、传输成本高,数据挖掘效率低,另一方面随着数据维数的增加,数据的运算量会呈指数倍增长,产生“维数灾难”问题。多视角数据降维已成为机器学习领域的热点研究方向之一。目前多视角数据降维的研究还存在以下不足:(1)已有算法侧重学习多视角数据的低维公共空间,该空间无法同时包含多视角数据的公共信息和互补信息;(2)已有算法没有在多视角数据上实现判别局部对齐,多视角低维空间的判别性有待加强;(3)实际应用中面临标记样本不足的问题,需要建立更符合实际应用的多视角数据降维算法。为解决上述问题,本文以近年来发展的多视角子空间学习和数据降维方法为基础,重点探究多视角数据降维算法及其在高光谱图像分类中的应用,主要研究内容和工作包括以下几个方面:1.针对在低维空间中同时保持多视角数据公共信息和互补信息的问题,结合近邻关系,提出了基于局部近邻对齐的无监督多视角数据降维算法。该算法首先基于多视角数据的互补性和交互性,将低维空间作为多视角数据的源空间,学习多视角低维充分空间,保持多视角数据的公共信息和互补信息。其次,该算法基于不同视角近邻关系不同的特点,使用多视角数据的公共近邻或互补近邻作为低维空间中的近邻关系,实现对数据原始近邻关系的保持,并通过局部近邻对齐增强低维空间的判别性。该算法在瑞士卷数据上的实验实现了对数据公共信息和互补信息的保持,同时该算法在物体、室内场景、人脸图像的分类实验中也取得了很好的分类效果,表明了算法的有效性。2.针对提高低维空间判别性的问题,结合多视角低维充分空间和判别局部对齐,提出了基于判别局部对齐的有监督多视角数据降维算法。该算法在有监督情况下,基于多视角低维充分空间已经融合多视角数据公共信息和互补信息的特点,提出在低维充分空间上进行判别局部对齐,约束局部同类近邻靠近、异类近邻远离获得判别性强的低维空间。多个数据库上的实验表明,该算法仅使用少量的同、异类近邻,就可获得很好的分类效果。3.针对标记样本不足的问题,基于半监督学习能够利用未标记样本的信息提升算法性能的特点,将半监督学习中的直推式学习与多视角数据降维相融合,提出了基于直推式学习的半监督多视角数据降维算法。并通过约束标记样本围绕其类别中心分布,提高低维空间的判别性。高光谱图像作为一种典型的高维数据,其标签获取代价昂贵,标记样本不足时的高光谱图像分类是一个亟待解决的问题。本文将基于直推式学习的半监督多视角数据降维算法应用于高光谱图像分类,不同高光谱图像数据库上的分类实验表明,该算法在标记样本较少的情况下具有最优的总体分类精度,且在数量大的地表物质上的分类效果有明显提升。4.直推式学习仅可以对未标记样本进行标注,半监督学习中的纯半监督学习则能够实现对未知新样本的预测,因此针对标记样本不足的问题,结合纯半监督学习,又提出了基于空间信息的半监督多视角数据降维算法。其中,空间信息能够包含数据的近邻关系,可用于选取合适的未标记样本。高光谱图像作为一种典型的高维数据,空间信息在其分类任务中十分重要。本文将基于空间信息的半监督多视角数据降维算法应用于高光谱图像分类,多个数据库上的高光谱图像分类实验表明,该算法在标记样本较少的情况下具有最高的分类精度,且对于标记样本的数目变化有很强的鲁棒性。