基于随机森林的降雨估计模型与算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yuwenhuaji11987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精细化短临降雨预报(约1公里×1公里空间分辨率、6分钟时间分辨率,0-2小时预报)对奥运会、阅兵等大型公务活动、航天器发射等科研活动、农业灌溉、水利发电、洪涝灾害预警等方面具有重要意义。降雨估计是降雨预报的基础,精准的降雨估计结合时间序列降雨外推技术或数值模式方法可以实现降雨预报。但是受风速、风向、地形、降雨气象条件、降水相态、降雨类型等因素影响,传统的降雨估计方法难以满足高分辨率条件下降雨估计精度要求,如何提升降雨估计准确性是挑战性的研究课题。为了提高气象实况估计和预报能力,我国已经建成覆盖全国的雷达、卫星和地面气象要素监测网络,并采集了大量的观测数据。亟需研究新的模型与算法,有效利用这些观测资料提升降雨估计准确性以满足应用需求。近年来,随机森林算法因其具有易于实现模型并行,大数据模型训练时不容易过拟合,与深度学习相比需要计算资源少等优点,在大数据挖掘知识竞赛和众多实际领域应用中取得了显著成效。  本文以随机森林算法为基础,研究多源数据特征融合表示、时空建模和不平衡数据回归的理论与方法。首先,针对晴雨估计问题,提出了多视角权重随机森林(Multi-View Weighted Random Forests,MVWRF)模型和推理方法,利用雷达、卫星和地面观测多源数据,提升了晴雨估计准确性;其次,针对降雨量估计问题,提出了以降雨过程为输入的时空模型(Random Forest and LinearChain Conditional Random Field based Spatiotemporal Model, RANLIST)和三阶段近似优化算法,以降雨过程时序关系和雷达反射率因子空间邻域相关关系为基础,建立降雨量估计的时空模型,挖掘数据中的时空信息,提升了降雨量估计准确性;最后,针对强降雨估计问题,提出了不平衡回归重采样(MulticlassOver-sampling and Under-Sampling,MOU)和集成回归模型(Resampling basedRandom Forest,RRF),提高了强降雨估计的准确性。  主要工作和创新点如下:  (1)提出了一种多视角权重随机森林算法(MVWRF),用于晴雨估计。在此过程中:(a)提出一种视角构建方法,分别构建VisCAPPI、VisPPI、VisSat和VisGround等视角,使得时空分辨率不一致的雷达、卫星和地面观测多源数据、能够统一到一个多视角框架下处理;(b)提出一种多视角权重随机森林模型和模型推断方法,实现了多源数据融合建模,协同雷达、卫星和地面观测多视角进行晴雨估计,发挥了多源数据针对晴雨估计的互补作用;在真实数据上实验表明:新的算法在晴雨估计准确率、召回率、漏报率、空报率等评价指标上优于其它算法。  (2)提出一种新的时空模型(RANLIST),用于降雨量估计。在此过程中:(a)提出了一种“结构+统计”的降雨量估计时空模型,该模型利用了雷达反射率因子空间邻域结构和降雨过程时间序列结构(结构),以及随机森林机器学习挖掘数据内部信息(统计);(b)提出一种基于随机森林和线性链条件随机场的模型近似求解方法,RANLIST模型按降雨过程进行模型训练和测试,充分挖掘降雨过程的整体对于降雨量估计的作用;在真实数据上实验表明:本文提出算法与次优算法相比,显著提高了降雨量估计的准确性。  (3)提出一种混合重采样集成回归算法(MOU_RRF),用于强降雨估计。在此过程中:(1)提出了一种针对强降雨回归问题的MOU混合重采样方法,首次综合利用多类不平衡过采样和多类不平衡降采样方法,处理不平衡回归样本;(2)提出一种RRF集成回归方法。该方法能对过采样、降采样和混合采样分类方法进行扩展,用于处理回归问题。在真实数据集上的强降雨回归估计实验表明:所提出的样本混合重采样集成回归算法,在强降雨估计效果上优于传统的气象方法、支持向量机和随机森林机器学习方法、以及典型过采样、降采样和混合采样集成回归方法。  (4)提出了降雨估计模型训练和测试的执行流程和框架,晴雨估计、降雨量估计和强降雨估计算法成果在全国范围内应用,生成全国雷达精细化降雨估计产品,实现了约1公里×1公里空间分辨率降雨估计,结合光流法外推实现了0-2小时短临降雨预报。
其他文献
危害公共安全、妨碍社会正常秩序的涉贪涉恐涉黑犯罪是目前最为严重的犯罪行为,作案手段极其复杂,打击难度大,对公民和国家造成了极大损失。在实际侦查中,这类犯罪的作案人往往具
本文主要研究了一种水下自主机器人--自主机器鱼基于视觉的自主定位问题。旨在构建一个完整的视觉定位系统,使自主机器鱼能够依赖单个摄像头,通过采集到的场景图像来实时确定
随着人类社会进入智能化的大数据时代,海量增长的图像资源和日益普及的智能设备都要求我们实现更加有效的图像语义解析,对图像内容进行快速、准确地理解。图像语义分割作为一种
无刷直流电机(Brushless DC Motor,BLDCM)是随着电力电子技术的不断成熟而发展起来的一种新型的电机。由于采用了电子换向装置,它克服了有刷直流电机的机械换向所带来的电火
作为数字地球基础的航测图像,在国土资源调查、森林防火、减灾、城市规划、特大工程设计等方面的应用越来越广泛。航空摄影测量需求数字航测相机应同时具备高分辨率和大视场
学位
功能近红外光谱成像技术是新近发展起来的一种利用近红外光来检测组织血氧变化的无创新型光学脑功能成像技术。该技术可以同时提取大脑含氧血红蛋白、脱氧血红蛋白以及总血红
电子罗盘能够利用地磁场来精确测量方位角,因此它在航空航天、航海、浮标、水下定向、钻井设备、机器人定向、陆地天线、气象中的风向仪、地震监测等领域有着广泛的用途。目
学位
随着大数据时代的发展,音频内容分析对海量数据的存储和利用有着越来越重要的作用,但目前存在的声学特征已经无法很好地表征日渐复杂的音频内容,也无法满足人们越来越高的分类精
多尺度几何分析也称后小波分析,是图像系数分解发展的一个分支,包含了目前最新的调和分析和稀疏逼近的发展趋势。在数学分析、计算机视觉、图像处理、模式识别中多尺度一直扮
减摇鳍自1889年问世以来,无论是在船舶减摇上还是在水下机器人作业中其优越性能是显而易见的。为此对于仅依靠改变壁面形状就能提高升力的变形减摇鳍升力模型的建立对今后减