论文部分内容阅读
中国的山区面积接近70%,地质灾害频发。泥石流是一种常见的地质灾害,是固体-液体混合物的重力驱动运动,造成的经济损失和人员伤亡十分巨大。泥石流易发性分析对于山地灾害的预警和管理具有重要的指导意义。泥石流易发性分析可以根据区域环境因子推测泥石流发生的可能性。本文选择泥石流频发的西藏日喀则地区作为研究区域,利用卫星遥感数据和泥石流事件历史资料,结合地理信息系统(Geographic Information System,GIS)和机器学习算法对泥石流易发性进行研究,并得出影响泥石流发生的主要环境因子,为日喀则地区城市建设和规划提供科学依据。首先,获取和计算影响泥石流发生的16种环境因子,并基于GIS对多源数据的属性进行统一。其中,归一化潜热指数(Normalized Difference Laten Heat Index,NDLI)首次被应用于泥石流易发性分析。根据频率比法分析环境因子与泥石流分布之间的关系,并将结果作为自组织映射(Self Organizing Maps,SOM)神经网络的输入,进行泥石流易发性分析,同时可以生成“非泥石流”单元。验证结果表明,聚类方法对泥石流易发性分析具有可行性和合理性。然后,从基于SOM的泥石流易发性图中选取“非泥石流”单元,并与泥石流单元一起作为五种机器学习方法的输入(后向传播神经网络,一维卷积神经网络,决策树,随机森林以及极限梯度提升树(Extreme Gradient Boosting,XGBoost)。本文首次将SOM和XGBoost结合,并应用于泥石流易发性研究。使用五种模型评估方法(Precision,Accuracy,Recal,F1 score以及AUC)的结果表明,SOM-XGBoost模型的测试准确率最优:XGBoost(0.953)>RF(0.943)>1D-CNN(0.939)>BPNN(0.932)>DT(0.898),对研究区的预测结果与泥石流分布拥有较好的相关性,且预测效率较高:DT(0.7)>XGBoost(4.5)>BPNN(7.6)>1D-CNN(8)>RF(10.8)(单位:min)。最后,基于树的特征因子重要性对16种环境因子进行排序。实验结果表明,NDLI对泥石流的发生具有最为显著的影响,另外三个主要因子分别为年平均降雨量、剖面曲率以及平面曲率。