论文部分内容阅读
在气候变化的背景下,全球洪水灾害事件的发生频率和强度不断增加,给社会经济发展带来了严重威胁。随着观测技术的发展,多源观测数据在体量、质量和共享化上有了长足的进步,然而目前在利用对地观测大数据进行洪水灾害事件的监测和损失预测研究方面还存在着以下不足:现有的洪水事件划分成果在关于灾害影响范围方面的信息有所缺失;基于合成孔径雷达(SAR)遥感数据的洪水淹没范围监测缺少大尺度的对比验证,相应的洪水淹没数据集少有发布;融合多源大数据在事件尺度上的洪灾损失预测研究鲜有报道。因此,本文以美国大陆地区为研究区,基于对地观测大数据,运用数据分析、融合、图像处理和机器学习等方法,开展了国家级尺度的洪水事件识别、淹没范围监测和灾害损失预测研究。主要研究内容和结论如下:(1)提出了基于多源观测数据的洪水事件潜在影响范围划分和识别方法,并组建了洪水事件数据库—FEED。首先,基于多源观测数据,将洪水事件分为三种主要类型:河流洪水、暴雨洪水和海潮洪水,针对各类型洪水影响范围的基本特点,结合阈值法、分水岭算法和反向汇流法对洪水灾害的潜在影响范围进行了划分;然后,提出了一种时空聚类方法,对洪水事件进行聚类识别,在研究区内2016年1月至2019年6月期间共识别出21,589场洪水事件;最后,组建了能表征各事件潜在影响范围动态变化情况的FEED洪水事件数据库。结果表明:在空间上,洪水事件集中分布在密西西比河流域和沿海各州,其中以河流洪水为主要的洪水类型;在季节分布上,西部沿海、西南部、中西部和东部沿海区域的洪水事件分别多发于冬季、夏季、春季和秋冬两季,分布规律与现有数据库的结论基本一致;对比现有数据库,FEED一方面考虑了更全面的洪水事件成因,在空间影响范围上更具合理性,另一方面能够反映出洪水事件的时空动态性,FEED可为洪水事件时空范围的划定提供统一的参考范式,有利于灾害事件相关信息的融合与共享。(2)构建了一个基于Senitnel-1双极化SAR数据的自动化洪水淹没范围监测系统,在较大的空间和时间尺度下验证了结果的有效性。首先,利用时相校准和噪声水平检测法(TD)对RAPID算法进行了改进,形成TD-RAPID洪水淹没范围提取算法;然后,利用FEED数据库作为洪水事件的时空范围依据,基于TD-RAPID构建了一种从SAR图像搜索至洪水淹没范围提取的自动化系统;最后,通过检索研究区内2016年1月至2019年6月的所有Sentinel-1数据,获取了2,054和9,161幅事件期和非事件期图像,并进行了洪水淹没范围的监测。结果表明:TD法提供了一种有效应对Sentinel-1双极化SAR图像噪声的措施,提高了RAPID算法对淹没范围提取的总体成功率;大量的视觉对比和定量分析结果表明,淹没范围监测结果与其他同类数据的相符性较好;该系统在研究区内实现了准实时、无监督和自动化的洪水事件淹没范围监测,所获取的高分辨率淹没图已经成功为多个部门和机构,包括美国地质勘探局灾害应急管理小组、DFO洪水观测中心和联合国国际重大灾害空间观测平台等,提供了相应事件的防灾减灾决策支撑。(3)提出了一种融合多源观测数据的机器学习模型—ICLAIM,实现了洪水事件房屋保险理赔数量预测。首先,将FEED数据库与NFIP保险理赔信息进行叠置分析,定义事件-网格化的样本格式;其次,采用整合分类与回归的模型架构,融合包括基于SAR的高分辨率淹没图、建筑物位置、降水、海岸水位、地表覆盖、地形地貌、流域形态和房屋保险记录等的多源异构大数据,构建了ICLAIM模型;再次,为应对灾害损失样本的不均衡问题,提出了一套类别平衡重采样策略;最后,利用589场洪水事件共计258,159条保险索赔记录对应产生的446,446个样本,在四种交叉验证模式下对ICLAIM进行了严格地验证。结果表明:事件-网格化样本有效地关联了灾害损失信息及其所属洪水事件;ICLAIM和传统RF模型在网格尺度下的验证的R~2在0.5左右,RMSE和Pbias分别在20个理赔数和±20%以内,表明两者均具备一定的预测能力;ICLAIM的预测精度优于传统RF模型,体现了整合分类与回归模型架构的优势和类别平衡重采样策略的适用性;ICLAIM模型对未知区域和事件同样具有预测能力,尤其在县郡尺度下验证的R~2达到0.9,反映出较好的研究和应用价值。