基于Spark的迁移学习方法在电网数据分析中的应用研究与实现

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:tanmite123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的不断发展,数据挖掘方法在各行各业的研究中逐渐发挥出不可取代的作用,电网系统也迈入到了智能时代。在电力设备的故障诊断、用电预测以及节能减排等问题的研究中,传统的分类、聚类、关联规则等数据挖掘算法都已发挥出重要的作用,并且也取得了不错的效果。但是随着实际应用的不断扩展,传统的数据挖掘方法可能会面临诸多问题,通常情况下,一般的数据挖掘算法都会要求数据源足够充分,而当源领域数据较为稀疏时,一般的数据挖掘算法通常会由于欠拟合的问题很难取得理想的效果。作为一种新兴的机器学习方法,近年来,迁移学习在数据的挖掘分析中已经取得了一定的成果。迁移学习旨在研究不同分布的数据之间的耦合问题,从实际需求出发,选择较为充足的数据源作为迁移学习的源领域,待分析的数据作为目标领域,将源领域中训练出的学习规则应用在目标领域中,以在目标领域中获取更高的起点以及更加精确的数据分析规则。因此,将迁移学习方法应用到稀疏的电力数据中具有极高的实际意义。根据源领域和目标领域之间数据分布的差异,可以将迁移学习分为基于实例的迁移学习方法和基于特征的迁移学习方法。本文从这两个方面出发,完成了以下几个方面的工作。首先,针对现有的迁移学习算法trAdaboost算法中错误率可能收敛过快等问题,本文提出了对trAdaboost算法的改进以及并行化处理,并将改进后的模型应用于变压器设备数据中,完成了负载预测的工作。其次,通过对基于特征的迁移学习算法的研究,本文提出并实现了一种基于平衡领域适应的深度迁移网络模型,并将提出的模型应用到电力数据中,完成了变压器以及开关的故障预测工作。最后,通过对大数据分析平台的集成方法的相关研究,完成了以上两个迁移学习算法在平台中的集成工作。
其他文献
老年患者是非小细胞肺癌(non-small cell lungcancer,NSCLC)的主要患病人群。由于年龄因素,老年患者多器官储备下降,并发症的发生率较高,导致其耐受性较年轻患者低,治疗方案
阐述了漳泽水库渗流监测的现状及存在的问题,介绍漳泽水库渗流监测系统改造的设计原则、监测范围、监测项目及大坝,溢洪道,泄水洞和七一输水洞等建筑物渗流监测设施设计。
本文从绩效考核的方法和作用入手,探究360度绩效考核与传统绩效考核之间的差异,分析360度绩效考核法的优势,辅之通过研究360度绩效考核法在我国企业的实际应用情况,探讨360度
<正>商业健康保险是为广大人民群众提供健康风险保障的保险服务业,是现代服务业中具有后发优势的朝阳产业,同时也是我国多层次医疗保障体系的重要支柱,能够更好地发挥保险在
<正>近年来,美国投资银行资产管理业务收入呈稳定上升趋势,2011年,资产管理业务收入占美国投资银行总收入比重达27.6%,已成为投资银行的主要收入来源。从2011年美国投资银行
<正>一关于"五四"的讨论,往往首先碰上的问题,就是:你说的是哪一个"五四"?是指1919年5月4日学潮引发的一系列的政治、社会运动?还是以1915年《新青年》创办(或1917年移京造成
<正>存款保险制度设立的必要性和紧迫性现有的隐形存款保险制度存在着一定的缺陷人民银行作为最后贷款人承担救助责任的制度,容易引发严重的道德风险。金融机构为获取高额利
在成熟的资本市场上,上市公司股份回购是一种很普遍的现象。股份回购的动因主要有:财务杠杆假说、信息不对称假说、经理人股票期权、企业股价市值低估、控制权假说、企业融资
<正>近期在各地开展的动物诊疗机构专项执法检查中,一些宠物诊疗机构因使用人药被处罚。对此,有人认为宠物用药应与食品动物有所区别,不应"生搬硬套""一刀切",认为处罚失当。