论文部分内容阅读
电力服务营销中的用电异常数据检测,对于减少非技术性损失以及保障电网安全用电具有非常重要的意义。目前,我国电力企业异常用电检测主要面临着几个问题:(1)主要依赖专家经验、建立机理规则模型识别,识别能力不够,灵活性不足;(2)随着智能电网的蓬勃发展以及用电数据急剧增加,复杂的数据结构和海量的数据流使得大量异常信息淹没而无法得到有效检测;(3)异常数据的占比很小,属于典型的不均衡数据集挖掘问题,传统的用电异常检测算法早已不适用。因此,为了解决这些问题,亟需研发智能高效的异常用电检测算法来保障电力企业中的智慧用电管理。针对上述问题,本文的工作主要分为四大部分:(1)针对复杂多变的用电大数据,借鉴统计学习方法的思想首次提出一种基于各类异常定义的特征提取方法,提取了电量的同比和环比等具有相关性的电量特征作为异常数据特征。(2)针对不平衡分布的异常电量数据,提出一种基于超限学习机(ELM)和集成学习的融合的Ensemble-ELM异常用电检测方法。采用集成学习思想可以有效解决异常电量数据分布不均衡问题,以ELM作为基模型,对异常电量数据表征能力强、训练速度快且识别率高,最后使用多数投票方式进行表决,进一步提高异常电量数据检测准确率。(3)从数据平衡的角度出发,提出一种基于K-means SMOTE和核超限学习机(KELM)结合的K-means SMOTE+KELM异常用电检测方法。改进的K-means SMOTE算法用来合成少数异常电量数据,可以解决SMOTE采样过程中忽略类内的不均衡问题以及产生具有噪声的样本问题,最后采用KELM算法训练的人工神经网络用于特征学习和异常电量检测,可以把原始低维线性不可分电量数据转换成线性可分,提高异常电量数据的识别率。(4)从数据加权的角度出发,提出一种基于改进的Ada Boost-ID算法和增强型堆叠式多层深度网络EH-Dr ELM结合的深度加权的超限学习机(DWELM)的异常用电检测方法。其中,EH-Dr ELM可以用来提高特征以及有用信息的表征能力,改进的Ada Boost-ID可以进一步优化样本的权重,两种结构结合有效的解决了一般浅层加权分类算法对不平衡大数据分类检测不足能力。最后,基于国网浙江电力公司营销部用电大数据的仿真实验结果表明:本论文所提出的异常用电检测算法的检测精度均高于传统的检测方法,验证了模型的有效性。