论文部分内容阅读
互联网技术的发展以及各行各业对电能的需求不断增高,催生了能源互联网。在此背景下,居民用电逐步智能化,电网与用户之间实现用电信息双向交互成为必然趋势。同时,智能小区在不断发展的过程中积累了大量的用电数据,通过数据挖掘方法对用电数据进行挖掘并分析用户用电行为,可为电网公司制定科学合理的电力需求响应策略提供数据支撑。此外,电网将居民用电信息反馈给用户,帮助用户了解自身用电情况,规范用电行为,挖掘用电潜力。本文在国内外学者的研究基础上,面向能源互联网中居民用电数据的K-Means聚类算法展开了研究,主要研究工作包括以下几个方面:1.为解决传统K-Means算法中存在的初始聚类中心和K值确定问题,研究了一种基于密度Canopy的K-Means改进算法。该算法以密度Canopy聚类作为K-Means算法的预处理步骤,通过定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,在数据集中以权值积最大原则依次确定聚类中心,并把密度Canopy聚类结果作为K-Means的类别数和初始聚类中心,最终进行数据集的聚类分析。仿真对比实验结果表明改进的算法具有更高的聚类准确率和更强的抗噪声干扰性能。2.设计了一种基于云计算和改进K-Means算法的用电数据分析方法。针对智能小区基础用电数据,以MapReduce模型进行K-Means算法的并行数据挖掘分析。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明设计的分析方法运行稳定、可靠,具有很好的聚类效果。3.设计了一种基于改进K-Means的BP神经网络短时居民用电负荷预测方法。首先通过改进的K-Means聚类算法对居民历史用电数据展开聚类分析,然后,以聚类结果为依据,选取待预测用户所在类型的历史数据,有针对性地开展短时居民用电负荷预测工作。最后的仿真实验表明:结合K-Means聚类分析的BP神经网络负荷预测相比未结合聚类分析的预测具有更高的准确率。最后,对全文工作进行了总结,并说明下一步的研究工作。