论文部分内容阅读
遥感影像分类问题一直是遥感信息提取的热点问题,对于中等分辨率遥感影像,由于技术的有限性与地物的复杂性,具有相似光谱特征与空间形状特征地物的分类更是一个我们研究的难点。基于此,针对中等分辨率遥感影像精细分类问题,本文引入一种集成学习算法即自适应提升算法(AdaBoost)。由于中等分辨率遥感影像数据的可分性较低,含噪声较大,而AdaBoost算法对噪声敏感,易出现过拟合现象,所以提出一种改进的自适应提升算法模型(NP-AdaBoost),结果证明改进的算法更适用于研究区的精细分类。论文的主要研究方法及结果如下:(1)自适应提升算法的改进。针对样本噪声,考虑一个全概率公式的概念,把训练之后的样本数据分为4类。在一次实验中,样本分类正确与分类错误构成一个完备事件组,在分类正确与分类错误的条件之下该样本是噪声的可能性大小相当于一个条件概率。因此,构造了一个预测样本噪声的全概率模型,该噪声模型用来预测训练样本数据为噪声的可能性大小,模型的结果作为自适应提升算法的一个新参数。从理论上证明了改进后的算法在样本权值更新时,在分类正确的情况下,使噪声大的样本数据比噪声小的样本数据减小得更多;在分类错误的情况下,使噪声大的样本数据比噪声小的样本数据增大得更少。(2)改进算法的有效性验证。对实验数据进行仿真实验,数据集来自机器学习专用的UCI数据库,针对中等分辨率遥感影像的可分性,构造拥有不同属性特征的数据集模拟不同可分性环境,构造加入不同噪声比例的数据集模拟不同噪声环境。通过精度分析、训练误差分析以及测试误差分析,结果表明NP-AdaBoost算法在实验中能够使训练误差趋势更加平稳,减少过拟合现象,从而减小测试误差。(3)研究区地物的精细分类。选取2013 Landsat8 OLI遥感影像,提取用来分析植被的6种植被指数以及红光与近红外单波段特征,对相似地物类别林地与草地进行分类,通过与其它监督分类方法(最大似然、最小距离、马氏距离以及决策树)对比分析,结果表明改进的自适应提升算法是一种可以对中等分辨率遥感影像进行精细分类且精度较高的有效算法,与原始算法相比,Kappa系数提高了5.5%,总体精度提高了2.8%。