论文部分内容阅读
遥感图像分类问题是遥感领域和模式识别领域中的重要研究方向。在遥感图像分类问题的研究领域中,集成学习分类算法是近些年来的研究重点。如何结合遥感图像数据特点,有效地提高集成学习算法精度和运算效率一直都是研究的核心问题。以遥感图像为研究背景,以集成算法为主要的研究对象,分别从训练样本特征提取、基分类器间差异性以及算法局部模型集成等不同角度,对遥感图像分类问题展开研究。本文研究工作主要包含以下几个方面:(1)针对使用旋转森林集成算法处理遥感图像分类的特征提取问题,提出非负矩阵分解旋转森林算法和自动编码器旋转森林算法,可以有效地获取图像特征,构建差异性大的训练特征集,增加基分类器间的差异性,从而提高整体分类精度。在特征提取过程中,考虑到遥感图像数据具有非负特性,使用经典的旋转森林算法中的主成分分析方法进行特征提取,分解后所得矩阵容易引入负值,涉及正负数之间复杂对消的线性组合,其中负值元素缺乏直观的意义,可解释性差,影响算法整体分类精度。为此,使用非负矩阵分解方法进行特征提取,分解后的矩阵元素均为非负值,其元素在基础图像中均表示实际意义,非负约束可以将每个部分的特征组合成一个整体,更适合遥感图像数据。此外,考虑到遥感图像数据中存在非线性关系,主成分分析是一种线性变换方法,不能很好地处理数据间的非线性关系。而自动编码器方法既能表征线性变换,也能表征非线性变换,可以有效提取遥感图像数据中的复杂特征。使用所提的两种算法对遥感图像数据和UCI数据集进行仿真实验,均取得了较高的分类精度,以及表现出较好的泛化性能。(2)增加集成算法基分类器间的差异性是提高分类精度的有效手段,针对如何获取一组差异性大的基分类器问题,提出基于互信息的选择性集成的遥感图像分类方法和基于Q统计量的选择性集成的遥感图像分类方法。经典的集成算法,很少讨论基分类器之间的关系,选取部分差异性大的基分类器进行集成,并从理论和实验的两个角度进行说明,经过选择的基分类器组分类效果优于使用全部分类器的分类效果。同时,选择性集成算法可以大大提高整体的运算效率。在选择基分类器过程中,考虑到遥感图像数据存在多特征、高维数,并且含有高阶统计信息,基分类器模型间也呈现一种高阶统计关系,而互信息理论在处理高阶统计量时具有较好的效果,因此,使用互信息理论对基分类器间的差异性进行度量,选择一组差异性大的分类器,作为集成分类器。此外,考虑到集成算法的复杂度,Q统计量是一种成对度量方法,具有计算简单,易于理解等特点,使用Q统计量对基分类器间的差异性进行度量,在保证分类精度的情况下,可以提高运算效率。实验结果表明,所提的两种选择性集成算法可以有效地提高分类精度,同时具有很好的泛化性能。(3)考虑到高光谱遥感图像中,存在着复杂的光谱特征,针对高光谱遥感图像数据高维数、多特征,而且特征不都相同等问题,提出高光谱遥感图像分类的多约简核极限学习机算法和深度极限学习机算法。在多约简核极限学习机算法中,针对高光谱遥感图像中的不同特征,使用不同的核函数,多核组合具有更为复杂的动态特征表示能力,在处理高光谱遥感图像分类问题时,可以得到比较好的结果。此外,将深度网络模型和极限学习机相结合,来处理高光谱图像数据,针对特征多、维数大等特点,深度网络具有自动提取特征的功能,可以提高效率,通过自适应参数,达到对高光谱图像降维的目的,再结合极限学习机进行分类。使用高光谱图像进行仿真实验,结果表明,所提的两种算法在处理高光谱图像数据时,均取得比较好的分类效果,并且具有比较好的针对性和适应性。