基于机器学习模型的青藏高原日降水数据订正研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yangxfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
青藏高原独特的自然条件和气候特征对周边地区的气候和水文系统具有重大影响。降水是气候和水文过程模拟研究的主要驱动因子,其误差对陆面模型和水文模型模拟结果有直接影响。在当前全球变暖的背景下,研究可用于水文模型和气候模型的高时空分辨率降水数据集,对于模拟青藏高原的气候变化和水文过程具有重要意义。  青藏高原横跨数个气候带,气候特征复杂多变。但高原面上的气象站点数量较少且分布不均。遥感产品可以反映高原降水的面域特征,但在数值上存在一定的误差。因此青藏高原地区的降水产品,大多是通过气象站点观测数据插值、遥感降水资料反演与订正、数据同化或者气候模式运算等手段生成的。对于常用的CMORPH(Climate Prediction Center Morphing Technique)等遥感降水数据集,仍需要进一步的订正和误差评价。  研究表明,气温、风速、湿度和气压等气象因子,以及地形和植被等环境因子,与青藏高原日尺度降水的空间分布和降水量存在着一定的相关性。目前综合气象和环境因子来订正青藏高原日降水数据的研究还不多见。在对青藏高原地区降水发生和发展机制研究还不够充分、数据比较缺乏的情况下,机器学习模型能够通过综合多种相关因素挖掘降水数据本身潜在的变化规律,从而实现对降水的发生、发展和时空分布的模拟,适用于青藏高原地区的降水订正研究。本文采用多元自适应样条(简称MARS)、K-最近邻算法(简称KNN)、支持向量机(简称SVM)、多项对数线性模型(简称MLM)和人工神经网络(简称ANN)等五种机器学习模型,考虑多个环境因子(海拔、坡度、坡向、植被)和气象因子(气温、相对湿度、风速),订正基于遥感产品的CMORPH青藏高原日降水数据集,比较机器学习模型法与概率密度函数匹配法(简称PDF法)对CMORPH数据的订正效果,并将CMORPH订正值与融合了遥感数据和观测数据的ITPCAS(Institute of Tibetan Plateau Research,Chinese Academy ofSciences)降水数据进行比较,讨论机器学习模型在青藏高原日降水数据订正研究中的适用性。具体计算过程如下:以五折交叉验证方法来计算机器学习模型模拟的均方根误差(RMSE),筛选出RMSE最低的模型来订正CMORPH日降水数据,对比112个标准气象站点处的机器学习模型订正值、PDF订正值和观测值,分析模拟误差的时空分布,并以唐古拉、西大滩和五道梁3个未参加模型构建的气象站点观测值来进一步验证模型的订正误差。通过主成分分析法(简称PCA)和单因子订正法,分析模型采用的七种气象和环境因子对降水订正的贡献率。以包括青藏高原寒旱核心少雨区在内的青藏高原八个降水典型区的多年平均降水特征来评估CMORPH降水数据在青藏高原的空间分布特征。通过以上研究得出的主要结论有:  1.五折交叉验证的结果显示:KNN模型对CMORPH日降水数据的订正效果最佳,其次是准确度略低的SVM模型,MLM、MARS和KNN模型的模拟结果较差。综合各种模型本身的适用特点,应选取KNN模型进行订正研究。  2.对112个标准气象站点处降水值的误差分析表明,与CMORPH日降水的PDF法订正值相比,CMORPH日降水的KNN法订正值与实测数据的相关系数较大,偏差较小:根据已知的青藏高原八个降水典型区的多年平均年降水分布特征,CMORPH KNN法订正值的年累计降水在六个典型区表现较好,PDF法订正值的年累计降水在两个典型区表现较好,CMORPH原始值的年累计降水在一个典型区表现好。KNN法订正值的降水空间分布较为合理。  3.对唐古拉、西大滩和五道梁验证气象站的比较研究表明:CMORPH日降水的KNN订正值与PDF法订正值相比,与站点实测数据在日尺度和月尺度上的相关性更好,经过KNN模型订正后的单点降水数据误差得到改善。  4.CMORPH日降水的KNN法订正值的误差时间分布仍然体现出明显的季节变化趋势:表现为在夏季偏差大、RMSE大、相对偏差小;冬季偏差小、RMSE小、相对偏差大,春秋季居中。CMORPH年累计降水的KNN法订正值的误差分布呈现一定的地域特点:在横断山区和藏高原北部边缘的干旱/半干旱区域偏差较大,这与以上地区地形复杂、降水量以及其他气象因子、环境因子的空间差异性较大有关。  5.通过PCA法分析七种气象和环境因子对降水订正的贡献率,结果表明贡献率从大到小依次为海拔、相对湿度、坡向、植被、风速、气温、坡度,各个因子的贡献率相差不大,说明降水订正是气象和环境因子综合作用的结果,8km分辨率下整个青藏高原的降水特征不具有单因子依赖性。单因子订正法的结果表明七种气象和环境因子的单因子订正相关系数在0.88到0.61之间,从大到小依次为相对湿度、海拔、坡向、风速、气温、坡度和植被,与PCA法的结果相近,植被的订正效果不佳与植被数据的时间分辨率低和精度不够有关,单因子订正的误差高于综合因子订正。  6.与ITPCAS日降水值的比较结果显示:CMORPH的KNN订正值与ITPCAS日降水值相比,在唐古拉、西大滩和五道梁三个验证气象站的误差相近,CMORPH的KNN订正值误差略小。二者降水空间分布在七个典型区接近,但在青藏高原西部和北部,均存在一定的误差,CMORPH订正值的误差较大,这与该地区的遥感数据偏差较大,而观测数据较为缺乏有关。
其他文献
全球气候变化背景下,随着环境可持续发展问题逐渐受到科学界的广泛重视,预测生态系统的结构和功能以及生态脆弱性对全球变化的响应,成为可持续发展研究的热点问题。将可持续发展
随着时代的发展,遥感技术以它特有的优势在社会各个领域的应用范围得到迅速的扩大。3S技术在社会各个领域发挥着越来越重要的作用。矿业作为我国的基础产业,在国民经济与社会
学位
有些事情已经发生上一页中的图片表现了“有些事情将要发生”这行字逐渐消失的过程,这是吴升知提供的一个作品《逐渐消失的一页》的图解部分。实际上,还有另外夹在杂志中的一
望着枝头挂满果子的荔枝、龙眼园,通什市番阳镇布伦村委员会党支部书记冯友荣兴奋地说:今年的果树丰收在望。布伦村位于通什市西北面,距市区50公里,坡多田少。该村农民历年
森林是地球表面最重要的地表覆被类型之一,是全球水量平衡和水分传输过程的重要环节,关于森林的水文过程及其对流域径流的影响一直存在争议。目前该领域主要针对湿润地区的森林
1998年3月以来,乐东县纪委、监察局新的领导班子紧紧围绕经济建设这个中心,确立了“抓班子、带队伍、促工作”的总体思路,按照“政治坚定、纪律严明、作风正派、业务精通”
林火在其蔓延过程中,要受到多组分可燃物在各种气象条件(温度、风向和风力)和不同地形条件下的影响,具有不确定性、动态变化的特点,是一种十分复杂的现象;智能体具有自治性、
一个不重视阅读的学生是缺乏获取新知识能力、缺乏发展潜能的学生;一个不重视阅读的家庭是平庸的、没有智慧的家庭;一个不重视阅读的学校肯定是一个呆板的、沉滞的、只会应试的学校;一个不重视阅读的民族必然是没有希望的民族。而目前我国初中生课外阅读的现状不容乐观,真正有阅读习惯的学生实在太少。要改变这一现状,我们首先要从培养学生的阅读兴趣入手。兴趣是认识和从事活动的巨大动力,是推动人们去寻求知识和从事各种活动
目前最强势的传播平台是媒体的官方微博,它堪称轻骑兵,而微博用户轻思考、重判断、来情绪的特性,决定了它首先是一个体验平台,其次才是一个发布平台。正是这个原因,直接导致
协调经济发展与环境保护之间的关系,追求环境公平,不仅是一个科学问题,也是落实科学发展观的一个重要内容。淮河流域水污染问题严重。自上世纪70年代初开始水污染形式一直不容乐