论文部分内容阅读
精细化短临降雨预报(约1公里×1公里空间分辨率、6分钟时间分辨率,0-2小时预报)对奥运会、阅兵等大型公务活动、航天器发射等科研活动、农业灌溉、水利发电、洪涝灾害预警等方面具有重要意义。降雨估计是降雨预报的基础,精准的降雨估计结合时间序列降雨外推技术或数值模式方法可以实现降雨预报。但是受风速、风向、地形、降雨气象条件、降水相态、降雨类型等因素影响,传统的降雨估计方法难以满足高分辨率条件下降雨估计精度要求,如何提升降雨估计准确性是挑战性的研究课题。为了提高气象实况估计和预报能力,我国已经建成覆盖全国的雷达、卫星和地面气象要素监测网络,并采集了大量的观测数据。亟需研究新的模型与算法,有效利用这些观测资料提升降雨估计准确性以满足应用需求。近年来,随机森林算法因其具有易于实现模型并行,大数据模型训练时不容易过拟合,与深度学习相比需要计算资源少等优点,在大数据挖掘知识竞赛和众多实际领域应用中取得了显著成效。 本文以随机森林算法为基础,研究多源数据特征融合表示、时空建模和不平衡数据回归的理论与方法。首先,针对晴雨估计问题,提出了多视角权重随机森林(Multi-View Weighted Random Forests,MVWRF)模型和推理方法,利用雷达、卫星和地面观测多源数据,提升了晴雨估计准确性;其次,针对降雨量估计问题,提出了以降雨过程为输入的时空模型(Random Forest and LinearChain Conditional Random Field based Spatiotemporal Model, RANLIST)和三阶段近似优化算法,以降雨过程时序关系和雷达反射率因子空间邻域相关关系为基础,建立降雨量估计的时空模型,挖掘数据中的时空信息,提升了降雨量估计准确性;最后,针对强降雨估计问题,提出了不平衡回归重采样(MulticlassOver-sampling and Under-Sampling,MOU)和集成回归模型(Resampling basedRandom Forest,RRF),提高了强降雨估计的准确性。 主要工作和创新点如下: (1)提出了一种多视角权重随机森林算法(MVWRF),用于晴雨估计。在此过程中:(a)提出一种视角构建方法,分别构建VisCAPPI、VisPPI、VisSat和VisGround等视角,使得时空分辨率不一致的雷达、卫星和地面观测多源数据、能够统一到一个多视角框架下处理;(b)提出一种多视角权重随机森林模型和模型推断方法,实现了多源数据融合建模,协同雷达、卫星和地面观测多视角进行晴雨估计,发挥了多源数据针对晴雨估计的互补作用;在真实数据上实验表明:新的算法在晴雨估计准确率、召回率、漏报率、空报率等评价指标上优于其它算法。 (2)提出一种新的时空模型(RANLIST),用于降雨量估计。在此过程中:(a)提出了一种“结构+统计”的降雨量估计时空模型,该模型利用了雷达反射率因子空间邻域结构和降雨过程时间序列结构(结构),以及随机森林机器学习挖掘数据内部信息(统计);(b)提出一种基于随机森林和线性链条件随机场的模型近似求解方法,RANLIST模型按降雨过程进行模型训练和测试,充分挖掘降雨过程的整体对于降雨量估计的作用;在真实数据上实验表明:本文提出算法与次优算法相比,显著提高了降雨量估计的准确性。 (3)提出一种混合重采样集成回归算法(MOU_RRF),用于强降雨估计。在此过程中:(1)提出了一种针对强降雨回归问题的MOU混合重采样方法,首次综合利用多类不平衡过采样和多类不平衡降采样方法,处理不平衡回归样本;(2)提出一种RRF集成回归方法。该方法能对过采样、降采样和混合采样分类方法进行扩展,用于处理回归问题。在真实数据集上的强降雨回归估计实验表明:所提出的样本混合重采样集成回归算法,在强降雨估计效果上优于传统的气象方法、支持向量机和随机森林机器学习方法、以及典型过采样、降采样和混合采样集成回归方法。 (4)提出了降雨估计模型训练和测试的执行流程和框架,晴雨估计、降雨量估计和强降雨估计算法成果在全国范围内应用,生成全国雷达精细化降雨估计产品,实现了约1公里×1公里空间分辨率降雨估计,结合光流法外推实现了0-2小时短临降雨预报。