基于机器学习的智能电表故障多分类方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:JIADOS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能电表集成了电能计量、数据采集、远程费控等功能模块,具有操作简便、功能多样的优点,但同时由于其功能日益丰富、结构日益复杂导致其故障类型变得多样化。智能电表故障类型的准确判断,有助于指导运维人员制定合理的维护措施,减少故障维护时间,从而提高用电采集系统的稳定性并降低运维成本。基于机器学习的分类方法是解决智能电表故障多分类问题的一种有效途径。而现有智能电表故障样本数据呈现出不平衡的特点,实质是一个类不平衡的多分类问题。解决类不平衡的多分类问题是机器学习研究领域的热点和难点,深入研究该问题并提出相应的解决方案,不仅可以提高智能电表的故障分类准确率,而且可以对诸如情感分类、疾病分类等很多具有相似数据分布特点的应用领域问题的解决提供可行的思路,具有重要的理论意义和实际应用价值。据此,本文研究了基于机器学习的智能电表故障多分类方法,论文的主要工作如下:首先,研究了基于一对多框架的多分类方法。根据现有电表故障数据的特点,通过数据清洗与特征工程技术对原始数据进行了分析与处理。在对目标故障数据预处理的基础上,针对各故障类型样本数目分布不均的问题,结合二值化技术与不平衡学习方法,提出基于一对多框架的差分分区采样集成分类算法。该算法将原始多类数据转化为多个二类数据集后,使用每个二类训练数据集中多数类数目与少数类数目作为采样区间上下限,模拟等差数列构造过程以设定采样数目。为减少过拟合和多数类样本信息损失,在每次迭代过程中,根据样本分布特点提出 Safe-Random Undersampling(SRU)与 BR-SMOTE 采样方法对正负样本进行数目平衡后建立分类模型。使用公开数据集与实际电表故障数据集进行实验研究,实验结果表明所提方法可有效解决多类不平衡数据分类问题。然后,研究了基于多分类器系统的分类方法。针对不同子模型的不同特点,提出一种基于信任分数的动态融合集成分类算法。该算法在保证全局准确率的基础上提高整体分类模型的多样性,在选择阶段根据基于个体能力的F-score1对分类器池中的模型打分排序后再根据基于群体能力的标准Double fault(DF)进行再次挑选;在结果聚合阶段,根据测试样本所在局部区域内各类样本的分布情况以动态地过滤可信度低的预测结果,减少性能较差的分类模型对测试样本最终预测结果的干扰。以公开数据集与实际电表故障数据集为对象进行实验分析,实验结果表明所提方法可有效提高多分类器系统分类效果。最后,研究了结合不平衡学习方法与多分类器系统构建技术的多分类模型。为进一步提高故障分类准确率,提出基于一对多框架的动态平衡集成多分类模型。该模型结合二值化技术,使用差分分区采样方法对各类样本进行平衡以得到多份样本数目均衡的训练集。根据这些平衡样本集建立多个分类模型后,针对每个二类问题,利用基于信任分数的动态选择融合方法构建多分类器系统对测试样本进行在线预测。使用公开数据集与电表故障数据集进行实验分析,实验结果表明所提方法可有效提高整体模型的分类准确率。
其他文献
金融时间序列的长期记忆性是现代金融热门的研究方向之一。基于分形市场理论,可以有效地刻画金融时间序列元素之间的长期依赖关系。国内债券市场作为金融市场的重要组成部分,对其进行长期记忆性研究不仅可以帮助我们理解和分析市场特征,而且能够向前预测较长时期的资产价格变化趋势,从现实出发具有重要意义。因此,本文在分形市场理论的框架下,运用分形分析方法和时间序列分析法对我国债券市场进行如下研究:运用两种分布特征检
学位
图像描述生成技术将输入图片进行一系列复杂处理,输出该图片对应的自然语言描述,属于计算机视觉领域与自然语言处理领域相交叉的领域。图像描述生成技术能够将图像信息与自然语言描述联系起来,使计算机能够理解图像信息并生成相应的自然语言描述。基于场景的图像语义描述生成模型由编码器与解码器两部分组成:编码器由卷积神经网络实现,卷积神经网络对输图像信息进行提取,去除不重要特征,保留有价值特征并将其送入到解码器中进
学位
学位
随着工业领域的高速发展,工业控制网络对网络通信的实时性、可靠性和确定性的要求越来越高。传统以太网已经无法满足诸如航天跟踪遥测、网络安全以及生命体征监视等服务对于网络实时性和可靠性的需求。相比于传统以太网,时间确定性网络(Time Deterministic Network,TDN)具备高可靠性、安全性和实时性等优点,能够满足航空、航天、轨道交通等安全关键系统大数据量传输的需求。而时间触发以太网(T
学位
随着智慧城市、信息社会的建设和治安防控、打击犯罪的需求,越来越多的监控摄像头在各个场景、社区被投入使用。日益增多的摄像头同时产生了海量的视频数据,而且视频数据通常只能人工梳理,在面对大量视频数据场景下人工梳理方式代价高昂且效率低下。为了解决这个问题,本文针对行人检测、行人再识别任务进行研究,并设计实现了一套重点区域出入口人员分析系统,将非结构化的视频数据进行结构化处理,方便进行查询和梳理。首先,本
近年来,道路基础设施领域积累了相当数量的数据,如何对它们进行有效分析、让其价值得以体现,是当前迫切需要思考和解决的问题。道路对人们的日常生活有很大的影响,如果能尽早
目前,随着社会的进步,农村反贫困工作更加全面和复杂,不仅需要满足底层农民的最低生活保障,同时还要为贫困农民提供公平的条件和进入市场的资格。国家反贫困的保障兜底和共同富裕目标协同发展,其资金投放和扶贫方式逐年增加,但扶贫效果差强人意。作为农村反贫困最终实践主体的基层政府,在贫困户的瞄准上具有决定性因素,同时还在上级政府、市场和贫困户中起着带头和黏合作用。基于此,研究基层政府在农村反贫困中的行动逻辑显