基于集成学习的中长期水文预报研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:windyson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国洪涝灾害十分频繁,对经济和社会发展造成了巨大的损失。中长期水文预报具有较长的预见期,是一项重要的水利基本工作和防灾减灾的非工程措施,能够使人们在解决以防洪为代表的水资源相关问题时,尽早进行相关工作安排,减小损失以及增加效益。然而水文系统受到多方面因素影响,是一个复杂的系统,传统方法难以满足精度要求。如何引入新的预报模型、提高中长期水文预报的精度显得越来越重要。本文在综述国内外中长期水文预报模型的基础上,以虎跳峡坝区历史径流为研究对象,引入机器学习领域中广泛应用的集成学习方法,为中长期水文预报研究介绍了新的思路。本文首先通过互信息值这一指标分析了虎跳峡坝区的大气环流指数和历史径流等相关预报因子信息,挑选出150个相关指标作为预报特征。在此基础上经过深入研究,选择具有代表性的梯度提升树(GBRT)和随机森林(RF)算法以及结合策略,通过各种方式将回归树这种基学习器集成起来,有效地增加算法的泛化能力和降低过拟合的风险。实例分析中对虎跳峡坝区1959-1992年相关数据进行建模,并详细展示了各算法参数的选取过程,利用1993-2000年月径流资料对几个模型进行预测与验证,并与单一学习器支持向量机(SVM)进行比较分析;随后在利用GBRT和RF的基学习器——决策树划分结点时会将重要结点优先划分的特性,选择了10个最重要特征,并以线性回归为基准比较了各集成学习方法的优劣。研究结果表明,GBRT和RF集成学习方法在不同评价指标下各有优劣,RF预测得到的优秀结果要多于GBRT,但整体平均误差要高于GBRT,二者对径流的预报结果都优于SVM这种单一学习器,并且在非汛期达到很高的预报精度。以GBRT、RF、SVM加权平均的结合策略得到的优秀预报结果有了显著的提高,而其他指标则提高不大或是低于某种单一算法。经过特征挑选后以线性回归为基准比较各算法,各个集成方法在相对误差上显著领先,而均方误差(MSE)差别较小。而经过特征挑选后,普遍结果比不上挑选前。本文的研究过程也提供了研究预报因子的新思路。
其他文献
随着皮肤美容学科研究深入,研究目标前移至皮肤功能的维护和修复,体现了中医"治未病"思想在人体健康维护领域的发展趋势预示性和应用价值。中医"治未病"思想与中医学理论和实
目的探讨非小细胞肺癌发生肝转移的危险因素;发生肝转移后采用手术、单纯全身化疗、全身化疗联合肝动脉化疗栓塞三种疗法治疗效果比较。方法经查阅文献筛选出可能与非小细胞
我国当前已经产生了不少金融控股公司,但是由于法律存在的缺陷以及历史遗留问题导致了我国金融控股公司监管严重滞后。本文主要分析了金融控股公司风险,金融控股公司监管存在
目的了解安徽省某农村地区独居老年人焦虑的水平及影响因素,为改善老年人的身心健康提供重要的科学依据。方法整群抽取安徽省某乡镇的≥60岁,并在当地居住≥1年的独居老年人
在新型城镇化建设背景下,森林疗养的概念逐渐得到关注。森林疗养有利于人民健康生活,符合“健康中国”的国家政策,具有重要的研究意义和价值。本文从风景园林角度,通过对国内
刁约即苏轼诗中多次提及的刁景纯。《宋史》没有为刁约单独列传,只在其祖父刁衎传后附有寥寥几笔。《京口耆旧传》对刁约其人记载得较为详细。他不以文才和政绩著名,而以交游
<正>"书香一页,心香一瓣",学生语文素养的形成离不开大量的阅读积淀。读书,是万事之基,也是素质教育的基本途径。然而,在具体操作中,如何将课内与课外更好地衔接起来,如何顺
人们常说,画家所面对的挑战是怎样在一张空白的画纸上,加上一些东西来使它变得有艺术性而摄影家所面临的挑战则迥然不同,他们要从杂乱的环境中,通过运用各种构图技巧,把其中无关的
水生植被是浅水湖泊生态系统最重要的生态特征之一,了解其群落历史演化特征,对生态退化湖泊的修复有着重要指导意义。本学位论文以位于长江中下游地区典型草型湖泊梁子湖作为研
目的探讨末端回肠瘘确定性手术(择期右半结肠切除术)后吻合口梗阻的原因及联合使用非血管介入技术和肠内营养支持治疗的可行性和效果。方法2003年2月至2005年3月行末端回肠瘘