基于机器学习和多源数据的湘西北森林地上生物量估测

来源 :林业科学 | 被引量 : 0次 | 上传用户:rogiangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对传统森林资源清查方法成本高、时效性低和结果统一性差等问题,基于多源遥感数据,采用机器学习算法选择特征变量并建立估测模型,制作森林地上生物量(AGB)面分布产品,为森林资源信息化调查提供技术手段.[方法]以湖南省西北部为研究区,利用生物量异速生长方程将森林资源样地调查数据转换为AGB,筛选到393个样地AGB参考值.以Landsat-8数据为光学遥感数据源,提取各波段光谱信息、植被指数、纹理特征以及缨帽变换各分量;以ALOS PALSAR-2、Sentinel-1数据为雷达遥感数据源,提取各极化方式后向散射强度和归一化极化差分指数.结合高程、坡度、坡向地形因子,获得122个备选特征变量.采用逐步回归方法和随机森林(RF)算法筛选建模变量,分别建立多元线性回归(MLR)、RF和支持向量回归(SVR)模型.以均方根误差(RMSE)、相对均方根误差(rRMSE)和决定系数(R2)为模型评价指标,运用十折交叉验证法评价模型效果,选择最佳模型完成生物量制图,并选取5种中国或全球尺度生物量制图产品进行比较分析.[结果]在训练集上,RF模型表现最好(RMSE=12.8 mg·hm-2,rRMSE=21.1%,R2=0.93),其次为SVR模型(RMSE=26.1 mg·hm-2,rRMSE=43.3%,R2=0.55),MLR模型表现最差(RMSE=30.9 mg·hm-2,rRMSE=50.5%,R2=0.39);在测试集上,采用RF算法建立的模型表现(RMSE=30.1 mg·hm-2,rRMSE=51.3%,R2=0.42)同样优于MLR(RMSE=32.6 mg·hm-2,rRMSE=54.1%,R2=0.30)和SVR(RMSE=32.8 mg·hm-2,rRMSE=55.3%,R2=0.25).3种模型均显示出一定程度的低值高估和高值低估现象.RF模型选择出13个建模变量,包括PALSAR-2后向散射信息、高程以及Landsat-8光谱信息、植被指数、缨帽变换湿度与绿度分量差值.应用RF模型完成区域生物量制图,与其他产品对比,能够基本反映研究区内生物量分布情况,并显示出丰富的生物量分布细节信息,生物量范围为0~119 mg·hm-2,平均生物量为37.5 mg·hm-2,标准差为35.9 mg·hm-2.[结论]结合多源遥感数据与机器学习算法,能够准确、快速地测算大范围生物量,具有较大应用潜力.相比SVR和MLR模型,RF模型在AGB估测上的表现更优,RF算法能够从多源变量中有效筛选出适用于AGB机器学习建模的变量.
其他文献
全球变暖,温室效应更加明显,土地荒漠化加剧,耕地与此同时面积也在快速下降,土地资源的不合理使用,更加加剧了土地的资源浪费,但是土地利用类型系统又是一个复杂受多种因素影响难以研究的系统.不同土地利用的三维空间分布受自然环境和人类社会实践活动的多重因素影响,用传统单一的分形模型有一定的局限性,将边界维数和间系维数进行组合分析,用桃源县2000年、2005年和2010年的土地利用遥感数据,分别计算出3个时期各土地利用类型的边界维数和间系维数,得出在十年的变化中桃源县除水体外其他各种土地利用类型分布都变得更加不稳