论文部分内容阅读
随着电力公司大踏步的推进智能用电的进程,用户对电力系统输送的电能质量的要求越来越高,而电力负荷预测是保证电能质量的重中之重,直接影响电网的生产运行。准确、及时、快速的电力负荷预测,不仅能为电力系统调度部门制定发电计划提供依据,同时还是市场环境下编排供电计划和调度计划的保障。而且,随着智能用电采集系统的普及以及天气预报准确率的不断提高,全面、海量的用户用电数据和精准的气象信息,都让准确、及时、快速的电力负荷大数据预测成为可能。因此,利用大数据技术对智能用电产生的海量负荷数据进行精准、及时的分析和预测,对最大限度的提高规划质量具有重大意义。电力负荷预测系统的关键是负荷预测模型的构建,在电力负荷预测研究领域中,各国专家学者提出的电力负荷模型都很成熟,且已经成功投入运营。但是这些模型均采用单一数学算法,模型参数难以随数据的变化及时调整,且不能精确的描述负荷的变化规律,因此这些算法难以获得较高的预测准确率。而且随着智能电网的发展和电力大数据的到来,电力负荷数据由大量增长为海量数据,原有的处理平台在处理海量数据上遇到瓶颈,处理速度不能满足用户需求,所以,电网需要一个能够精确描述负荷变化趋势并且能处理海量数据的负荷分析预测系统。基于以上背景,本文深入研究了 hadoop、spark大数据处理平台以及随机森林算法在短期电力负荷中的应用,详尽了解电网短期电力负荷预测业务逻辑后,收集用电信息采集系统中的客户用电数据和营销业务应用系统中的客户档案信息,结合宏观经济、气象信息、节假日信息、行业开复工率、业扩报装信息、产业结构变化等方面的外部数据,综合分析负荷变化趋势及各种影响电力负荷波动的因素,同时分析了随机森林算法的优势和不足,提出基于spark平台的并行集成随机森林预测模型,利用已有的历史电力负荷大数据测试该模型,相较于原来的电力负荷预测算法,有较高的预测准确率,且具有处理海量数据的能力。同时利用springMVC架构模式构建电力负荷大数据分析预测系统,将并行随机森林预测模型的结果应用到实际的电力负荷预测业务中,从数据采集,系统服务和用户展示三个层面对系统进行开发,实现数据采集、负荷分析、模型管理、负荷预测以及有序用电等功能,与传统的负荷预测系统相比,该系统预测模型更加及时、准确,界面操作更加便捷、数据显示更加直观。