论文部分内容阅读
精细化的降水实况和预报是提高水文气象模型模拟精度和地质灾害气象风险预警准确性的重要前提,其中过去逐分钟降水和未来2小时分针级降水预报,是开展强降水导致的山洪、中小河流洪水和滑坡泥石流风险预警、灾害防治和应急避险的核心科学数据支撑。传统的降雨估计和外推方法难以满足高分辨率条件下降雨估计精度要求,作者开发的全国分钟降水预报系统V1.0针对全国183部业务运行的雷达基数据,采用机器学习算法,取得比传统算法更高的精度。以全国1km空间分辨率输出未来2小时逐分钟间隔的降水预报,6分钟更新一次。该系统于2015年7月在专家验收后正式运行,产品在中国天气网和腾讯微信上线。全国分钟降水预报系统V2.0在2016年5月经过对比试验和验收后上线,在以下4个方面具有创新性:(1)基于Spark平台的海量样本分析,针对183部雷达2010‐2016年共计100Tb数据和地面观测的分钟降水数据,能快速完成研究样本创建。(2)提出了一种多视角权重随机森林算法(MVWRF),用于晴雨估计。在此过程中提出一种视角构建方法,分别构建Vis CAPPI、VisP PI、Vis Sat和VisG round等视角,使得时空分辨率不一致的雷达、卫星和地面观测数据、能够统一到一个多视角框架下处理;提出一种多视角权重随机森林模型和模型推断方法,实现了多源数据融合建模,协同雷达、卫星和地面观测多视角进行晴雨估计,发挥了多源数据针对晴雨估计的互作用;在真实数据上实验表明:新的算法在晴雨估计准确率、召回率、漏报率、空报率等评价指标上优于其它算法。(3)提出一种新的时空模型(RANLIST),用于降雨量估计。在此过程中提出了一种"结构+统计"的降雨量估计时空模型,该模型利用了雷达反射率因子空间邻域结构和降雨过程时间序列结构(结构),以及随机森林机器学习挖掘数据内部信息(统计);提出一种基于随机森林和线性链条件随机场的模型近似求解方法,RANLIST模型按降雨过程进行模型训练和测试,充分挖掘降雨过程的整体对于降雨量估计的作用;在真实数据上实验表明:本文提出算法与次优算法相比,显著提高了降雨量估计的准确性。(4)基于机器学习的雨雪相态估计。针对大气温度廓线、气压廓线、地面温度、露点温度、相对湿度等要素,采用机器学习模型对雨、雨夹雪和雪进行训练,识别准确率85%以上。