【摘 要】
:
受气候、地理、人类活动等多要素综合影响,径流序列兼有周期性、随机性、趋势性等特点。河川径流承担着航运、发电、灌溉等重要作用,准确高效的径流预报对于水利工程调度、防汛抗旱决策以及水资源开发利用等工作具有重要指导意义。本文针对当前日径流预测模型预见期较短的问题,研究基于机器学习的水文建模和预报的理论方法。首先,构建贝叶斯岭回归(BRR)、支持向量机回归(SVR)、随机森林回归(RFR)、K近邻(KNN
【基金项目】
:
国家重点研发计划课题 (No.2017YFC1502704); 国家重点研发计划课题 (No.2016YFC0401501);
论文部分内容阅读
受气候、地理、人类活动等多要素综合影响,径流序列兼有周期性、随机性、趋势性等特点。河川径流承担着航运、发电、灌溉等重要作用,准确高效的径流预报对于水利工程调度、防汛抗旱决策以及水资源开发利用等工作具有重要指导意义。本文针对当前日径流预测模型预见期较短的问题,研究基于机器学习的水文建模和预报的理论方法。首先,构建贝叶斯岭回归(BRR)、支持向量机回归(SVR)、随机森林回归(RFR)、K近邻(KNN)、多元线性回归(MLR)五类简单单项机器学习模型,由校验数据确定各模型对应的最佳样本维度。其次,对于高维样本,在简单单项模型的基础上,通过累加法对样本降维,构建五类改进单项模型。再次,依据简单平均方法、加权平均方法和小波组合方法构建组合模型。选用平均绝对百分比误差、相对均方根误差、确定系数以及合格率四项评价指标,用于校验过程参数选优以及模型预测效果对比。研究结论如下:(1)五类简单单项模型适用于预见期小于5日的径流预报。将各项模型应用于长江流域的寸滩站、宜昌站、汉口站与大通站四个典型测站的日径流预测,研究发现,预见期短于5日时,五类模型的确定系数均高于0.9,各模型预测效果排序为:KNN>RFR≈MLR≈BRR>SVR,预见期超过10日,确定系数均低于0.9,各模型预测效果排序为:RFR>BRR≈MLR>SVR>KNN。(2)五类改进单项模型能够明显提升预报速度,并在一定程度上提升预报精度。五类改进单项模型分别为:IS-BRR、IS-SVR、IS-MLR、IS-KNN、IS-RFR,改进单项模型通过累加列向量的方法对样本降维处理,缩减了训练和预测时间,IS-BRR和IS-MLR模型预报速度提升2倍,IS-KNN、IS-RFR和IS-SVR模型预报速度提升约30倍,在预测精度方面,各项模型的确定系数增加5%~30%。其中,IS-BRR模型、IS-SVR模型和IS-MLR模型的预测特点相似,预测曲线较为平滑。IS-KNN与IS-RFR模型预测特点相似,预测曲线锯齿偏多。(3)简单平均组合模型、加权平均组合模型、小波组合模型的预测性能依次提升,均优于相应的改进单项模型,且预见期越长,各项组合模型的提升效果越显著。每种组合方法对应六项组合模型:BRR-RFR,BRR-KNN,MLR-RFR,MLR-KNN,SVR-RFR,SVR-KNN,相比于改进单项模型,三种组合方法所对应的18项组合模型的确定系数提升5%~40%。对于每一种组合方法,BRR-RFR和MLR-RFR模型的预测效果最优。(4)18项组合模型对大通站和汉口站的预测效果优于寸滩站和宜昌站。预见期为30天时,寸滩站和宜昌站各项组合模型的平均绝对百分比误差为0.18~0.25,高于汉口站与大通站(0.13~0.15),寸滩和宜昌站的相对均方根误差为0.4~0.5,高于汉口站与大通站(0.18~0.23),对于寸滩站和宜昌站,预测效果有待优化。
其他文献
目的:通过对化痰活血宽胸方联合中药足浴治疗冠心病不稳定型心绞痛(痰瘀互结证)的病例进行回顾性研究,探讨化痰活血宽胸方联合中药足浴治疗冠心病不稳定型心绞痛的临床疗效,并为临床治疗该疾病进一步提供中西医结合治疗的思路及方法。材料与方法:选取河北省中医院心血管科2017年9月-2019年9月期间符合纳入标准的西医诊断为冠心病不稳定型心绞痛,中医诊断为胸痹心痛病(痰瘀互结证)的住院患者共150例。根据临床
海陆风是发生在沿海地区由海陆热力差异引起的中尺度局地环流,通过影响大气边界层来改变局地的温度、湿度还有风场等气象要素,进而对局地天气、气候产生影响。受局地天气和地形等条件的影响,目前对于海陆风的探讨多局限于局部地区或城市,对于中国沿海多地海陆风的比较研究还比较缺乏。本文利用2015——2018年的气象观测数据和再分析资料等统计中国沿海主要城市群的海陆风天气特征规律并比较不同地区间的差异,分析纯海陆
“建设教育强国是中华民族伟大复兴的基础工程”,提升高等教育质量,建设一流学科、培养一流人才,提升学生综合素质成为21世纪的教学主流。为了更好的培养学生的合作能力,带动学生全面发展,本文对在线教育进行相关分析,结合时代特征,笔者将MOOC和SPOC(Small Private Open Courses)的比较,通过相关数据的分析和整理,了解当今SPOC的发展状况并结合当今线上教育的研究热点,针对当前
时间序列预测问题的研究至关重要,从电商销量预测到股票价格预测等,随处可见其应用场景。时间序列预测任务也是学术界长久以来的研究重点,随着数据形式的复杂化,模型也从最初基于序列稳定性假设的传统统计学方法发展到可以处理非平稳数据的机器学习方法,然而序列特征表示和损失函数的设计等问题仍然是时间序列预测面临的挑战。本文针对时间序列预测中的特征表示问题,结合现在神经网络方法的优势,利用时序卷积模型、注意力机制
共享经济的号召和互联网的迅速发展滋生了很多有活力的企业,这些企业平台遍布于人们的衣食住行。传统模式下,房屋租售更多是通过电话资源、售楼部实地查看或者是其他更多通过人力来解决的方式。这种模式下的房屋交易,不仅费时费力,也不具备很好的透明度和安全性。一些销售平台的出现,如链家网、贝壳找房等,具备了房屋展示功能,用户可以浏览和选择,但是仍然缺乏非常便利的沟通功能。基于当前市场房屋资源的不合理闲置率,以及
品牌竞争力的核心就是提高对手的准入成本,提高消费者的转换成本。品牌无法长红,错的不是流量而是品牌无根首先,我们看一个网红品牌是怎么诞生的。我现在给出一个公式:高成长赛道+大流量曝光+大网红带货=网红品牌。首先,这个产品必须处于一个高成长的赛道。如近几年的美妆、新茶饮、
SWAT分布式水文模型已广泛地应用于流域水资源的模拟研究。然而,SWAT模型中地下水模块较为简单,而地下水作为区域水资源的重要组成部分,其与地表水在时空上的交互关系对区域地表-地下水资源联合调度具有十分重要的意义。因此,本文以句容市北山水库流域为例,采用SWAT-MODFLOW分布式耦合模拟程序在QGIS软件平台构建该流域的地表-地下水耦合模型,阐明研究区地表-地下水相互作用关系,对完善中小流域的
量子计算机与经典计算机相比较有独特的优势。它的计算能力随着比特数目的增加而指数增加,且更适合用来模拟量子系统,因此量子计算已成为当前的研究热点。实现量子计算的物理体系有很多,超导量子比特,离子阱,NV色心等。超导体系由于和半导体技术兼容,可拓展性强,是当前很有潜力的方案之一。本文首先介绍了量子计算的原理,介绍了量子比特,量子门和量子测量。其次通过引入电路量子电动力学,我们介绍了超导量子比特原理,包