论文部分内容阅读
森林地上生物量(Aboveground Biomass,AGB)是评估森林生态系统生产力和健康状况的重要参数,对全球碳循环和气候变化具有重要意义。通过遥感等手段提取与森林AGB相关的波段特征、植被指数、纹理特征、地形特征等特征变量,特征变量往往较多,影响估测精度。通过改进Boruta算法,可以有效的减少遥感估测森林AGB过程中的特征冗余,减少了误差的传递,为遥感反演提供了一定的借鉴意义。本研究以湖南国有芦头林场为研究区域,以Sentinel-2遥感影像和NASA DEM数据为基础数据,以研究区域内的二类调查数据为实测数据。选取纹理特征、单波段、植被指数、地形特征等为备选自变量,以样地AGB为因变量。通过皮尔逊(Pearson)相关性分析筛选出与森林AGB相关性显著的28个自变量组成最优变量组合,构建支持向量回归(Support Vector Regression,SVR)模型。再用改进Boruta、LASSO、RF(Random Forest,RF)三种特征选择算法分别优化SVR模型,对比分析四种森林AGB估测模型的精度。最后选取最优模型反演研究地AGB,并制作研究地AGB空间分布图。研究主要内容及结果如下:(1)森林AGB遥感特征变量提取与相关性分析。通过对Sentinel-2遥感影像的波段组合、纹理信息提取、主成分分析以及多种植被指数的计算,提取了 16个植被指数、10个单波段、11个主成分纹理特征,从30m空间分辨率的NASA DEM数据中提取3个地形特征,同样地AGB进行Pearson相关性分析。研究结果表明,森林AGB与各植被指数之间的相关性较好,与部分遥感波段之间存在较显著的相关性,与部分纹理特征的相关性不太高,与地形特征中的DEM有较强的相关性。(2)基于SVR模型的森林AGB估测。森林AGB众多变量进行相关性分析之后,选取线性核函数、径向基(Radial Basis Function,RBF)核函数、多项式核函数、Sigmoid核函数共4种核函数建立SVR模型,以建模集和验证集的判定系数(R-Squared,R2)、均方根误差(Root Mean Squard Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)为模型精度评价标准,在对比不同核函数建模精度的同时进行SVR模型参数的寻优化。研究结果表明,选取RBF核函数作为SVR模型的主要核函数,网格搜索法和十折交叉验证作为参数寻优的方法,建立SVR模型进行森林AGB估测。采用验证数据检验SVR模型的精度,研究结果表明,SVR 模型验证集的R2为 0.60,RMSE 为 36.46t/ha,MAE 为 24.79t/ha。(3)基于改进Boruta算法优化SVR模型的森林AGB估测。改进Boruta算法是为初始特征(m行n列,即有m组样本,n个初始特征,m>1,n>1)创建一个影子特征,影子特征是通过将初始特征按比例P(0<=p<1)提取出[m*p]*n组样本,进行随机行变换后放回得到,然后将初始特征和影子特征混合,形成新的特征组合。基于XGBoost的多次迭代,比较每个初始特征的重要性与影子特征的最大值Z分数(Zscore),得到最佳特征组合,构建改进Boruta-SVR模型进行森林AGB估测。研究结果表明,改进Boruta-SVR模型验证集的R2为0.68,RMSE为24.31t/ha,MAE为17.97t/ha,精度较不加改进Boruta特征选择的SVR模型精度有较大的提升。(4)森林AGB遥感估测模型的精度对比分析。为了体现改进Boruta算法的优势,研究中还引入LASSO、RF(Random Forest,RF)两种特征选择算法分别优化SVR模型。通过对比SVR、改进Boruta-SVR、LASSO-SVR、RF-SVR四种森林AGB估测模型。研究结果显示,基于高维的遥感特征变量、未经特征优化构建的SVR模型精度最低,其次是LASSO算法优化的SVR模型优于RF优化的SVR模型,改进Boruta算法优化的SVR模型精度是最高的,选取改进Boruta-SVR估测模型对研究地AGB进行反演。(5)最终选用改进Boruta-SVR模型对整个芦头林场AGB进行反演,得到研究地AGB空间分布图。研究结果显示,研究地AGB总量为4.53*105t,空间分布呈现出南北走向,由南往北逐渐变大且密集,主要分布于芦头林场地势平缓的西北、东北以及中部地区,研究地AGB空间分布情况与实际调查到的研究地地质地貌以及森林植被分布情况大致相吻合。