论文部分内容阅读
[目的]针对传统森林资源清查方法成本高、时效性低和结果统一性差等问题,基于多源遥感数据,采用机器学习算法选择特征变量并建立估测模型,制作森林地上生物量(AGB)面分布产品,为森林资源信息化调查提供技术手段.[方法]以湖南省西北部为研究区,利用生物量异速生长方程将森林资源样地调查数据转换为AGB,筛选到393个样地AGB参考值.以Landsat-8数据为光学遥感数据源,提取各波段光谱信息、植被指数、纹理特征以及缨帽变换各分量;以ALOS PALSAR-2、Sentinel-1数据为雷达遥感数据源,提取各极化方式后向散射强度和归一化极化差分指数.结合高程、坡度、坡向地形因子,获得122个备选特征变量.采用逐步回归方法和随机森林(RF)算法筛选建模变量,分别建立多元线性回归(MLR)、RF和支持向量回归(SVR)模型.以均方根误差(RMSE)、相对均方根误差(rRMSE)和决定系数(R2)为模型评价指标,运用十折交叉验证法评价模型效果,选择最佳模型完成生物量制图,并选取5种中国或全球尺度生物量制图产品进行比较分析.[结果]在训练集上,RF模型表现最好(RMSE=12.8 mg·hm-2,rRMSE=21.1%,R2=0.93),其次为SVR模型(RMSE=26.1 mg·hm-2,rRMSE=43.3%,R2=0.55),MLR模型表现最差(RMSE=30.9 mg·hm-2,rRMSE=50.5%,R2=0.39);在测试集上,采用RF算法建立的模型表现(RMSE=30.1 mg·hm-2,rRMSE=51.3%,R2=0.42)同样优于MLR(RMSE=32.6 mg·hm-2,rRMSE=54.1%,R2=0.30)和SVR(RMSE=32.8 mg·hm-2,rRMSE=55.3%,R2=0.25).3种模型均显示出一定程度的低值高估和高值低估现象.RF模型选择出13个建模变量,包括PALSAR-2后向散射信息、高程以及Landsat-8光谱信息、植被指数、缨帽变换湿度与绿度分量差值.应用RF模型完成区域生物量制图,与其他产品对比,能够基本反映研究区内生物量分布情况,并显示出丰富的生物量分布细节信息,生物量范围为0~119 mg·hm-2,平均生物量为37.5 mg·hm-2,标准差为35.9 mg·hm-2.[结论]结合多源遥感数据与机器学习算法,能够准确、快速地测算大范围生物量,具有较大应用潜力.相比SVR和MLR模型,RF模型在AGB估测上的表现更优,RF算法能够从多源变量中有效筛选出适用于AGB机器学习建模的变量.