论文部分内容阅读
森林资源调查是遥感应用的重要领域,基于高光谱技术的树种识别是林业遥感颇具挑战性和实用性的发展方向,基于实测光谱数据的树种识别模型研究是实现星载或机载成像光谱数据树种识别的重要基础。长汀县曾经是我国水土流失的重灾区,经过长期的生态治理与修复,如今的长汀县已经是中国南方红壤区水土流失治理的一面旗帜,森林面积大量增加,森林覆盖率大幅提高。对该地区植被恢复状况进行调查,尤其进行树种类型和分布的调查,对于做好森林资源管理和生物多样性评估具有非常重要的意义。因此,本研究选取长汀县的7种树种(马尾松、杉木、闽粤栲、香樟、柑橘、枇杷和杨梅)为研究对象,利用ASD Field Spec4野外光谱仪测定不同树种冠层的高光谱数据。通过分析不同树种在多种光谱变换下的光谱特征,筛选光谱特征波段,运用机器学习的随机森林(Random Forest,RF)、极端梯度提升(e Xtreme Gradient Boosting,XGBoost)和梯度提升树(Gradient Boosting Decision Tree,GBDT)3种分类算法进行树种识别,以构建典型树种高光谱识别模型,进行XGBoost与GBDT基于高光谱数据树种分类的适用性评价,并利用XGBoost和RF分类算法进行光谱特征波段重要性分析。本研究的主要结论如下:(1)通过对不同数据类型光谱特征的分析可知,差异较大的特征波段主要集中于可见光波段的绿光区域与红光区域、近红外波段内960 nm和1100 nm附近的2个水吸收带、短波红外波段内1650 nm附近的反射峰。(2)对比RF、XGBoost和GBDT分类算法对不同类型光谱数据进行树种识别分类可知,3种分类算法对去包络线光谱数据的分类效果最佳,且XGBoost算法分类效果优于RF和GBDT。XGBoost对原始光谱数据、一阶微分光谱数据、二阶微分光谱数据和去包络线光谱数据的总体分类精度都分别为95.83%、91.67%、94.64%和95.83%,平均F1分数分别为0.96、0.92、0.95和0.96。在不同数据类型和不同分类器组合的树种识别研究中,“原始光谱数据—XGBoost”模型和“去包络线光谱数据—XGBoost”模型的树种识别效果最好。(3)通过XGBoost与GBDT分类效果同RF分类效果的对比分析可知,原始光谱数据、二阶光谱数据和去包络线光谱数据的总体分类精度和平均F1分数均表现为:XGBoost>GBDT>RF,一阶微分光谱数据的总体精度表现为:GBDT>RF>XGBoost,平均F1分数表现为GBDT>RF=XGBoost,因此XGBoost和GBDT适用于高光谱数据树种识别研究,且分类效果良好。(4)通过XGBoost和RF算法对所筛选的光谱特征波段进行波段重要性分析可知,相比较近红外波段和短波红外波段,可见光波段是进行树种识别的最重要波段。