论文部分内容阅读
电力负荷预测在电力系统规划和发展的过程中承担了十分重要的角色,准确的预测有助于降低成本并优化决策。合理的进行负荷预测对电力系统规划及其重要,是电力事业持续、稳定和健康发展的必然要求,具有显著的经济和社会效益。天气、经济条件等各种不同因素均会对电力负荷的波动产生一定的影响,导致负荷预测存在较强的不稳定性。近些年,学者们对于电力负荷预测方法的研究逐渐深入,众多负荷预测的方法相继被提出,但是使用单一模型进行负荷预测时普遍存在的问题是单一模型无法充分展现负荷的变化规律,对于不同的数据集不能保证预测精度的稳定性,因此负荷组合预测模型逐渐受到人们的关注。本文首先介绍了电力负荷预测与组合预测的概念与研究背景,论述了组合预测的意义和基本原理,并详细介绍了随机森林、分位数回归森林、梯度提升回归树、分位数回归梯度提升、XGBoost和LightGBM等常用的机器学习回归算法的基本原理与算法流程,以及简单平均、基于模型性能的加权平均、普通最小二乘预测组合、最小绝对偏差预测组合等组合方法的基本原理。此外,介绍了两种模型评估采用的评价指标:MAPE与RMSE。由于单一模型难以对所有数据集都得到最佳的预测精度,为了解决这一局限性,进一步提高短期电力负荷预测的精确度与稳定性,本文构建了一种基于机器学习算法的优化组合预测模型:基于特征提取-贝叶斯优化(Feature extractionBayesian optimization,FE-BO)组合预测模型。该组合预测模型主要包括以下四个步骤:数据预处理、基于模型XGBoost的特征提取、单项模型训练、模型组合。首先对数据进行归一化和缺失值处理。之后,基于XGBoost模型得出特征重要性分数并进行排序,计算出的特征重要性得分用于输出一个特征子集,该子集将除去多余的特征。最后,使用贝叶斯优化法对模型的超参数进行调参,并使用选定的特征和优化的参数构建最终组合模型。本文基于国内A地区的2019年1月至10月的实际电力负荷数据集与天气数据集,应用新提出的FE-BO组合预测模型进行实证分析。首先把数据集以月份为单位分为十一个数据集,然后分别采用随机森林、分位数回归森林、梯度提升回归树、分位数梯度提升回归树、XGBoost和LightGBM六种单项预测模型对十一个电力负荷数据集分别进行最后24小时负荷的点预测,再通过简单平均、基于MAPE的加权平均、基于RMSE的加权平均、普通最小二乘预测组合、最小绝对偏差预测组合这六种组合方法对单项模型进行组合预测,通过误差评价指标MAPE与RMSE选出精度较高的基准模型,分别同特征提取与贝叶斯超参数优化后的FE-BO组合预测模型的预测精度进行比较。通过实证分析,与未经优化的原始模型以及未经优化的组合预测模型相比较,本文提出的FE-BO组合预测模型在预测精度和稳定性上都具有较强优势,在短期电力负荷预测中有较好的预测效果。