基于可解释机器学习的多模式ENSO预测结果智能会商系统

来源 :国家海洋环境预报中心 | 被引量 : 0次 | 上传用户:xiaoc009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ENSO预测主要依赖于动力模型和统计模型。计算机计算能力的不断提升和机器学习算法的再次发展给ENSO预测提供了新的工具。国内外研究结果表明,利用机器学习方法进行天气预报、气候预测以及模式结果订正、释用,其技巧评估可达到或优于传统方法。本研究基于预测会商工作的思想,利用可解释机器学习方法——决策树算法建立了多模式ENSO预测结果智能会商系统,模拟会商工作的流程,给出预测结论及预测依据:分别使用基于Boosting的GBDT、XGBoost、light GBM和基于Bagging的RF四种树模型方法,同时结合随机采样交叉验证、网格搜索交叉验证两种超参数调整方法对树模型的超参数进行智能优化调整,根据不同超前预报时效分别建立多模式ENSO预测结果订正模型,给出各模式预测结果在智能会商系统中的特征重要性,得到预测结果。最后,将基于决策树方法的集合平均结果同动力模式、统计模式集合平均结果做对比。主要结果如下所示:在建模过程中的可解释方面,该智能会商系统给出了各模式预测结果的特征重要性。不同的决策树模型表现出较为一致的偏好,超前预报时效较短时,偏重于动力模式;较长时,偏重于统计模式。这与在不同超前预报时效上,动力模式、统计模式预报技巧的高低相吻合。而黑盒模型则无法给出该解释,只能给出预测结果。从时间序列图来看,四种树模型方法预测结果均有如下特征:在超前1~3个seasonal month预报时效上相位和强度同标签值基本一致;在超前4~6个seasonal month预报时效上相位和强度和标签值偏差较小,存在过拟合问题;在超前7~9个seasonal month预报时效上相位和强度和标签值偏差都比较大。总体而言,随着预报时效的增加,相位滞后程度逐渐加大,强度的偏差也越来越大。从预报技巧评估指标来看,不同决策树模型在不同超前预报时效上预报技巧表现不一。seasonal month1~3,基于GBDT的订正模型预报技巧最优;seasonal month 4~5,基于XGBoost的订正模型预报技巧最优;seasonal month 6~7,基于light GBM的订正模型预报技巧最优;seasonal month 8~9,基于RF的订正模型预报技巧最优。从集合平均结果对比来看,在各超前预报时效上决策树模型的预报技巧评估指标均达到或优于动力模式、统计模式。本研究的创新之处在于,实现了机器学习建模过程的可解释,超参数调整的智能化、客观化,会商流程的自动化、智能化。特别地,使用可解释机器学习的方法进行多模式集合订正,尝试对机器学习算法的建模预测过程作出一定程度的解释:给出不同超期预报时效上各模型预测结果的特征重要性,以期对今后的ENSO预测会商工作提供参考。
其他文献
初中英语课程标准明确指出要培养学生的听说读写能力,这是英语教学的重点,"写"这一能力要依靠写作教学来完成,因此写作训练是初中英语课堂教学的重点内容。写作是一种知识输出的过程,是一种知识的运用过程,教师要改变过去重单词阅读轻视写作的教学方法,在实际教学中重视写作方法的讲授,以期提升学生的写作能力。1.创设教学情境,教授写作方法学生写作能力低下的部分原因在于缺乏写作基础知识,在面临写作问题时无从
期刊
目的探讨运动-音乐疗法干预对维持性血液透析患者运动功能、负性情绪及疲劳状态的改善效果。方法选取2019年3月至2020年4月我院行维持性血液透析的60例患者。按随机数字表法将其分为对照组及观察组,每组各30例。对照组给予血液透析常规护理,观察组在对照组护理基础上加用运动-音乐疗法。观察两组患者运动功能、负性情绪及疲劳状态。结果护理后两组患者疲劳状态评分均有所下降,且观察组低于对照组;两组患者6 m
可折断式螺纹钉内固定治疗股骨颈骨折山东省文登市整骨医院(264400)黄相杰,周志高,谭庆远,毕晓英,朱惠芳我院自1990年应用可折断式螺纹钉内固定治疗股骨颈骨折256例,现就有1年以上随诊结果的212例进行分析。临床资料本组212例,男122例,女...
期刊
海洋约占地球表面积的71%,是决定地球气候发展的主要的因素之一,作为海洋水文环境参数最重要因素之一的海表温度一直是海洋学家的研究重点。影响中国降水的主要因素有受印度洋和太平洋的海温驱动的季风,台风、以及不同时间尺度的海温和海气耦合震荡。过往的大多研究中都是以某一具体海洋区域的温度异常或者局部海域的海温、海气耦合震荡来研究海温对中国降水的影响。但无论是季节内震荡还是年际或者年代际震荡,都不可能完全解
为提高热带气旋的短期气候预测水平,利用1951-2011年西北太平洋热带气旋(TC)资料、中国气象局的西太平洋副热带高压资料及美国NCEP的850hPa风场资料,分析了西北太平洋TC的长期变化趋势及影响TC活动的可能原因。分析得出:西北太平洋TC的生成个数存在逐年减少的年际变化特征,按1970年前、1970-1990年、1990年以后三个时间段划分,TC的生成个数存在逐年减少的年代际变化特征。三种
热带气旋造成的大多数人员伤亡和财产损失是由风暴潮造成的,随着海平面上升与沿岸人口的不断增多,预计风暴潮将给沿海地区带来更多更大的风险。常规数值方法和传统经验方法已经掌握了风暴潮的部分规律,但这仍然是一个非线性非平稳的多变量影响的问题,一直以来各种风暴潮分量之间的相互作用对风暴潮的峰值水位发生时间和发生位置的贡献仍然难以确定。机器学习技术在过去的十多年在地球科学领域展现了很强的灵活性,无论是单纯的数
中国处于西北太平洋西岸,是世界上受台风灾害影响十分严重的国家之一,因为我国拥有绵长的海岸线,所以台风登陆我国沿海尤其是经济发达地区造成的经济损失和人员伤亡更为惨痛。本文针对影响台风最为关键的海温要素以及台风发展过程中不可忽视的海气相互作用过程进行数值试验分析,以探求海气耦合模式中海温要素对台风的影响。利用美国国家环境预报中心和中国国家海洋环境预报中心提供的高时空分辨率RTG_SST、MLSST海温
本文对2011年登陆我国的最强台风17号“纳沙”、路径预报误差最大的09号台风“梅花”进行了资料的收集整理,通过卫星云图、500hPa高度场等观测资料利用天气学方法分析了“纳沙”与“梅花”在移动过程中路径与强度发生变化的情况及其原因。同时,基于动力学相关理论推导出位涡平流方程式,并利用质量可靠的高分辨率的再分析资料,对二者高空位涡平流场和高空加热场分布的时空变化进行了诊断分析。通过分析可以发现:位
学位
海岛散落在海洋中,不仅具有丰富的自然资源,也是我国贯彻习近平总书记海洋强国战略思想,发展海洋经济、保障海洋权益和维护海防安全的重要依托。合成孔径雷达因其信息量大、信息获取速度快、可全天时、全天候观测等优势,可以很好地应对和满足海岛复杂的地物环境及精细化的监管需求,成为了海岛调查的一种重要手段。21世纪以来,深度学习在遥感信息提取中的优势日益凸显,成为了各国学者研究的热点问题。与传统的机器学习方法相
X线电视定位下髓蕊减压植骨术治疗成人早期股骨头缺血性坏死第三临床学院骨科刘玉坤,段德生校直属医院钟显春关键词股骨头,缺血性坏死,髓蕊减压术中图号R681.8R687.341991年9月至1993年10月,我们借助X线电视定位行髓蕊减压植骨术,治疗成人...