论文部分内容阅读
随着节能减排的不断推进,对电力能耗准确预测的需求变得日益迫切,同时,物联网技术的不断发展,使得电力能耗数据采集规模不断扩大,在海量的数据基础上进行预测,单机环境势必会遇到计算资源不足的瓶颈,如何快速处理这些海量数据进行预测同时达到电力能耗预测准确性的要求已成为近年来的热点研究方向。基于此,本文建立了一种STL-SVR电力能耗预测模型,并通过Spark分布式处理平台实现此模型对大规模数据的快速处理。本文的主要工作如下:(1)引入STL(Seasonal and Trend decomposition using Loess)时间序列分解结合支持向量回归SVR(Support Vector Regression)建立STL-SVR电力能耗预测模型。针对单一模型无法实现准确的电力能耗预测的问题,通过引入STL时间序列分解,将电力能耗数据分解为趋势项、周期项与余项,并分别根据每项的特点采用支持向量回归算法预测或其他方式进行处理之后整合得到总体模型,实现了电力能耗数据的准确预测。(2)引入模拟退火算法优化SVR的参数选择。针对使用网格搜索进行SVR算法的参数优化缓慢的问题,通过引入模拟退火算法这一适用于大型组合优化问题的算法实现SVR的参数优化,大大加快了SVR算法的参数优化效率。(3)STL-SVR电力能耗预测模型的并行化。针对海量数据下单机环境遭遇计算资源不足,算法运行缓慢的问题,引入了Spark分布式处理平台,在Spark上实现了包括数据预处理、特征工程处理和SVR算法的并行化,建立了基于Spark的STL-SVR电力能耗预测模型。在保证预测精度的同时,缩减了海量数据下模型的训练时间。本文基于提出的STL-SVR预测模型进行了三组实验,分别是回归森林、SVR、STL-RF模型与STL-SVR模型的对预测比实验,使用模拟退火算法与网格搜索进行SVR参数优化的对比实验与单机环境与Spark环境下STL-SVR模型的对比实验。实验结果表明,基于Spark的STL-SVR预测模型相比单机环境下的传统算法更具竞争力,在预测精度与参数优化效率上有了明显提升,在海量数据下也能同样保持较高的运行效率。