基于机器学习的电力异常数据检测

来源 :电子科技大学 | 被引量 : 17次 | 上传用户:hellomfc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电力行业的快速发展,累计了大量的数据,这些数据主要来自发电、输电、变电、配电、调度和用电等各个环节。异常数据检测在电力系统中也起着非常重要的作用,在配电网中,使用异常检测方法可以发现影响电能的各种异常状态,找出源头,防止故障继续扩散,从而及时止损。对于设备监控,异常检测可以帮助检查设备运行状态,有效的保证设备的稳定运行。对于智能用电系统,异常检测可以提高电网的服务水平,有效的节约人力资源,降低运营成本,使电网能比较经济的运行。传统的方法无法满足海量数据挖掘的要求,而基于机器学习的方法近几年在大数据上的应用发展迅速。本文介绍了电力行业数据的发展情况和异常检测的背景和意义,根据数据分析的过程,介绍了数据清洗、数据转换和数据降维的一些步骤和方法。针对不同的分析方法,本文研究了如何将这些方法改进,使其能运用到异常检测中来,其中包括基于概率的方法,基于机器学习的方法和频繁模式挖掘的算法。基于机器学习的算法中本文重点研究了基于线性模型的方法,基于邻近的方法和集成的方法。对于局部异常值的检测,基于聚类和局部离群因子(Local Outlier Factor,LOF)算法的结合,可以准确的发现局部异常点,但是LOF的复杂度较高,无法快速的做异常检测,对于实时性要求较高的应用,这将是瓶颈。而基于集成方法的孤立森林算法,只有线性的复杂度,但同样具有精确的异常检测效果,于是本文提出使用聚类算法和孤立森林的结合方法做异常检测。与LOF结合使用的聚类算法一般为K-Means,但此算法聚类效果一般,所以本文改用Affinity Propagation算法,Affinity Propagation算法不仅具有优秀的聚类效果,而且算法还有很多特性优于K-Means。电力数据中有一类数据包含了大量的类别特征(标签),告警数据就属于其中。这类数据的异常检测,使用上述方法是有困难的,所以本文改进FP-Tree,以使其可以用于对告警数据进行频发告警挖掘。通过实验用实际的数据进行数据分析,对算法的结果做展示。最后展望未来的发展方向,探索未来研究的新思路。
其他文献
建筑能耗基准评价是指通过确定建筑能耗基准值来评估建筑用能水平及相应节能潜力,并在此基础上提供可行而有效的节能建议,在当前建筑节能减排的大背景下越来越受到国内外研究
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
“近零排放”提出了排放的烟尘、二氧化硫、氮氧化物排放分别要低于1毫克/立方米、10毫克/立方米和25毫克/立方米的目标。在当前发展的各种烟气清洁技术中,使用炭作为吸附剂
目的比较开腹与腹腔镜右半结肠全结肠系膜切除(CME)术对患者免疫球蛋白水平及营养状况的影响。方法回顾性分析2017-01-2019-01间鹤壁市人民医院收治的68例右半结肠癌患者的临
高校教务秘书的工作性质要求其必须具备高度的执行力,才能更好地完成各项工作。文章从实际出发,强调了高校教务秘书工作中运用良好执行力的重要性。
随着科学技术的不断进步,机械制造业取得了显著的成就。为了满足当前机械制造业发展的需求,在机械工具上采用先进的设计制造技术被提上日程。机械制造企业只有充分的认识采用
预测属于一类内容复杂、规模庞大的非线性优化问题,在电力系统中占有重要地位,也决定了电力系统经济运行的基础。近几年,很多国家纷纷致力于风功率发电预测,但由于影响风功率
该文依据步进电机在自动控制系统中的应用,介绍了利用微机灵活控制步进机的有效方法。
利用热重方法研究了煤粉与废线路板的单独及混合燃烧特性.研究结果表明,煤粉与废线路板的混烧特性总体上表现得较为复杂,是两者共同作用的结果.废线路板单独燃烧时,热失重过