论文部分内容阅读
我国洪水灾害频发,严重威胁着我国人民的生命财产安全,每年造成巨大的经济损失和人口伤亡,如果可以在洪峰峰值和洪水到达时间上实现高精度的预报,提前指导灾区人民紧急避险,就可以将损失大大减少。传统的洪水预报模型涉及洪水产生的物理过程,面临着计算复杂,后期维护成本高,开发周期长等困境。即使是专业人士,在传统模型迁移到新流域后,其内部主要的十几个参数也需要较长时间的推断以及实地测量才能确定。随着计算机技术的发展,尤其是计算机计算能力的提高,以机器学习为主导的计算机科学技术得到了大范围的应用,利用保留的历史水文数据,采用机器学习的技术搭建有效的洪水预报模型取得了丰富的成果。但是现有的基于机器学习以及深度学习技术的洪水预测模型存在着数据特征挖掘不足的情况,尤其是对于输入的降雨数据仅仅挖掘了明显的时序特征,而忽略了其固有的空间分布特征。这种特征挖掘不足的现象,使得整体的洪水模型预测精度不高,且极易出现过拟合现象。本文采用机器学习的技术设计了两类模型来对洪水的峰值以及洪水到达时间进行准确预测,一方面避免了传统模型手段中面临的复杂度极高的参数率定问题,另一方面通过引入卷积操作有效的解决了现有机器学习模型中普遍存在的降雨数据空间分布特征挖掘不足的现象,本文所作的主要工作如下所示。1)本文首先对研究区域进行地形环境研究,明确了水文站之间的实际地理空间分布。对原始的流量以及降雨数据进行预处理,进行缺失值补全、数据归一化、数据特征相关性分析等操作,为模型的设计与训练提供数据支撑。2)提出了基于卷积自编码器结构的空时特征融合分析模型CAe-RNN(Convolutional Autoencoder Recurrent Neural Network),针对于现有的数据驱动模型对降雨数据空间分布特征挖掘不足的问题,本文引入卷积自编码器结构来进行空间特征挖掘,构建了CAe-RNN模型。具体工作如下:A.将研究区域的降雨数据进行二维网格化处理,利用卷积神经网络对所生成的网格化降雨进行分析,来提取降雨数据的空间特征。B.采用预训练的方式对卷积自编码器参数进行矫正,有效避免网格化后数据量激增以及网络参数过多导致的训练速度慢的问题。C.提取出的降雨空间特征按照时间步的先后顺序进行组合,进一步通过循环神经网络挖掘其在时序上的关系,实现空时特征的融合分析。D.结合河道历史流量信息,预测模拟输出未来一个时间段的洪水流量数据。3)创新性的将图神经网络相关概念引入到洪水预测领域,提出了基于频域的图卷积神经网络空时特征融合分析模型GC-RNN(Graph Convolutional-Recurrent Neural Network)以及基于空域的图注意力网络空时特征融合分析模型GA-RNN(Graph Attention-Recurrent Neural Network)。上述两种模型均可以有效的解决现有的降雨数据空间分布挖掘不足的问题,同时还极高程度的模拟了实际降雨汇聚过程。具体工作内容如下:A.原始数据抽象为图数据,将实际雨量站、河道抽象为图数据中的节点与边,每个站点的降雨量作为对应图数据中节点的属性值。考察实际河流的流向来构建不同节点之间边的方向。B.构建深层图卷积神经网络、深层图注意力神经网络对生成的图数据进行空间分布特征的提取挖掘。C.对图数据提取出的空间分布特征进一步通过循环神经网络,挖掘降雨的时序信息,实现空时特征的融合。D.结合河道历史流量信息,预测模拟输出未来一段时间的洪水流量数据。为了测试本文构建模型的实际效果,基于河南省息县境内50个水文站的历史降雨和流量数据进行实验。在全年河道流量的预测效果上,洪水峰值与洪水到达时间预测误差均满足水文生产规范。为了进行模型预报等级评估,挑选历史数场典型的洪水过程进一步考核,CAe-RNN、GA-RNN、GC-RNN分别被评定为甲级、乙级、丙级洪水预报模型,均可以用来指挥实际的洪水预报行动。为了证明本文所提出的模型提取降雨空间特征带来的优势,与现有的无空间特征提取的模型进行实验性能对比,结果表明,本文提出的模型在预测误差上降低了15%到40%,证明了所述模型设计思想上的先进性与合理性。