论文部分内容阅读
网损系统中低压线路数量繁多,之间相互关系错综复杂,输电系统运行方式也各种各样。表计采集缺失,变户关系不匹配,偷电漏电等多种因素都会造成网损数据难以统计和预测。网损的计算方法有运用均方根电流和等值电阻的传统方法,这些方法假设简单和系统实际情况悬殊较大。也有类似等效节点功率法的潮流计算方法,虽然与实际切合度有所提升但是需要较大的计算量和电网数据,针对低压线路的复杂网络没有可操作性。
为了简化网络复杂度,出现很多基于人工神经网络的方法,这部分方法收敛速度慢,参数难以选择。还有运用到核心向量机和向量回归的一些智能算法,虽然在收敛速度上有所提升,但是只能处理电气量无法对居民用电性质之类的非电气量进行处理。鉴于此,本文提出一种基于聚类和集成决策树算法的网损预测方法,充分运用数据挖掘的相关技术,在电气量、非电气量以及台区特征等多维数据库中提取影响因子较大的特征,有效地对网损进行预测。
首先是台区数据的清洗与准备工作,在缺失值填补方面运用了K-近邻(KNN)算法,该算法简便易行效率高,对异常值和噪声点有较高的容忍度而且不需要为不同属性进行建模。在异常值检测方面主要运用朴素贝叶斯算法进行电气量准确度的预测,该算法对缺失数据不敏感而且容易实现。然后进行特征工程工作,特征工程分为特征处理和特征选择两部分前者为后者服务,即通过对原始数据清洗和处理,将原始数据的属性转换为数据特征的过程并且在众多的特征中提取出对结果影响较大的特征项,可以有效地缩小数据量建立精简高效的模型。特征选择部分分别运用过滤法、弯刀法和嵌入法针对案例进行处理,得出三种方法各自的使用特点并且综合运用到特征选择中,最后对多种方法表决一致的特征权值大小进行排序。建模和预测部分首先从线损系统、生产管理系统和营销系统中抽取用户特征、变压器特征和整体特征,再运用具有噪声且基于密度(DBSCAN)的聚类算法区分出不同的类别,针对不同类别运用决策树和随机森林算法建立相应的分类模型和估计模型。最后对永州市某地区的线路情况进行模型预测与分析,预测出网损异常的台区,从技术性角度结合各种可能的原因推导出相关的矫正系数,并且对异常值进行矫正处理。基于数据挖掘的网损预测与实际情况结合维度高,能够更好地反映网损真实情况,对后续网损治理提供有效的指导。
为了简化网络复杂度,出现很多基于人工神经网络的方法,这部分方法收敛速度慢,参数难以选择。还有运用到核心向量机和向量回归的一些智能算法,虽然在收敛速度上有所提升,但是只能处理电气量无法对居民用电性质之类的非电气量进行处理。鉴于此,本文提出一种基于聚类和集成决策树算法的网损预测方法,充分运用数据挖掘的相关技术,在电气量、非电气量以及台区特征等多维数据库中提取影响因子较大的特征,有效地对网损进行预测。
首先是台区数据的清洗与准备工作,在缺失值填补方面运用了K-近邻(KNN)算法,该算法简便易行效率高,对异常值和噪声点有较高的容忍度而且不需要为不同属性进行建模。在异常值检测方面主要运用朴素贝叶斯算法进行电气量准确度的预测,该算法对缺失数据不敏感而且容易实现。然后进行特征工程工作,特征工程分为特征处理和特征选择两部分前者为后者服务,即通过对原始数据清洗和处理,将原始数据的属性转换为数据特征的过程并且在众多的特征中提取出对结果影响较大的特征项,可以有效地缩小数据量建立精简高效的模型。特征选择部分分别运用过滤法、弯刀法和嵌入法针对案例进行处理,得出三种方法各自的使用特点并且综合运用到特征选择中,最后对多种方法表决一致的特征权值大小进行排序。建模和预测部分首先从线损系统、生产管理系统和营销系统中抽取用户特征、变压器特征和整体特征,再运用具有噪声且基于密度(DBSCAN)的聚类算法区分出不同的类别,针对不同类别运用决策树和随机森林算法建立相应的分类模型和估计模型。最后对永州市某地区的线路情况进行模型预测与分析,预测出网损异常的台区,从技术性角度结合各种可能的原因推导出相关的矫正系数,并且对异常值进行矫正处理。基于数据挖掘的网损预测与实际情况结合维度高,能够更好地反映网损真实情况,对后续网损治理提供有效的指导。