基于云计算和机器学习的短期风电功率预测研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:dongxiaohu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国能源结构的调整,风电装机容量快速增长,及时准确地预测风电功率可为电网合理调度提供重要依据,减少弃风,有效地提高风电利用率。同时,随着风电场智能化水平的提高,风电监测数据规模不断增长,对传统风电功率预测模型的计算性能提出了新的挑战。近年来,以机器学习理论为基础的人工神经网络法和支持向量机法及其改进算法在短期风电功率预测中得到广泛应用,机器学习算法中存在较多迭代计算场景,云计算技术中的Spark分布式内存计算框架,可高效进行迭代式数据处理,有效提高算法的执行性能。针对现有短期风电功率预测模型存在泛化性较弱、模型结构和参数确定困难、可解释性差等问题,本文综合随机森林回归算法、M5P模型树、差分进化算法、选择性集成方法,提出了一种基于改进随机森林回归算法的短期风电功率预测方法,并采用Spark云计算平台实现算法并行化,主要开展了以下几个方面的研究工作:(1)传统随机森林回归算法以分类回归树为元决策树,针对分类回归树预测精度较低、不能给出一个连续的输出且预测值无法超出训练集数据范围等问题,本文采用M5P模型树作为元决策树,在叶节点上构造多元线性回归模型,有效提高了元决策树的预测精度。(2)针对随机森林中存在部分预测性能较差且多样性较低的元决策树,本文提出了一种改进的差分进化算法,并将其应用到随机森林元决策树的选择性集成中,在所有元决策树中选择部分最优的元决策树子集构成新的随机森林,进行加权计算得到最终预测结果。(3)针对随机森林算法计算复杂度较高的问题,分析了随机森林算法和差分进化算法的并行性,研究了云计算体系架构,采用云计算技术中的Spark分布式内存计算框架,对上述预测算法进行并行化改进,有效提高了算法的执行性能。(4)以内蒙古某地区风电监测数据作为实际算例,将本文方法与现有短期风电功率预测算法和传统的随机森林回归算法进行对比;同时在实验室服务器上采用Cloudera公司的发行版CDH5版本搭建云计算平台,对提出的算法进行并行化性能测试。实验结果表明本文提出的方法具有较高的预测精度、泛化性能、可解释性,且具有较好的并行性能。
其他文献
从计划经济的改革到市场经济的今天,涌现了一大批中小企业,这些企业在推动经济发展、扩大社会就业、改善民生等方面起着举足轻重的作用。虽然中小企业的作用举足轻重,但其发
提出了城市降雨径流污染模型和海湾富营养化模型耦合模拟的方法,识别出了深圳湾受降雨径流污染影响显著的敏感区域和敏感时段,分析了城市降雨径流污染影响深圳湾富营养化的演
财政部项怀诚部长在1999 年全国财政工作会议上的讲话中明确指出: “转变财政职能, 优化支出结构, 初步建立公共财政的基本框架。” 这一重要讲话为财政理论界提出了研究西方公共财
<正>刘峰在2016年第12期《行政管理改革》撰文指出,《关于新形势下党内政治生活的若干准则》明确指出,坚持正确选人用人导向,是严肃党内政治生活、净化党内政治生态的组织保
【正】 一美国某些语言学家所建立的描写语言学(descrip-tive linguistics)是现代欧美资产阶级语言学中的一个派别,也就是现代语言学中的结构主义语言学的一个派别。美国人曾
本文讨论了汽车冷却系统在开发初期的设计方法,通过有效的计算和经验分享,设计出合理的汽车冷却系统,避免了整车在后期验证时冷却系统出现高温、冷却液泄漏、管路干涉等风险.
1概述金属材料的腐蚀,按其腐蚀机理可分为化学腐蚀和电化学腐蚀.而非金属材料与金属材料不同,电导率一般很小,甚至几乎不导电,它同电解质溶液接触时不会形成原电池,因而不会
<正>脂代谢紊乱是血脂代谢不平衡、血脂成分出现不适当地增高或降低的状态,通常指总胆固醇(TC)、三酰甘油(TG)、低密度脂蛋白胆固醇(LDL-C)升高,高密度脂蛋白胆固醇(HDL-C)降
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技