论文部分内容阅读
随着信息社会的不断发展,数据挖掘方法在各行各业的研究中逐渐发挥出不可取代的作用,电网系统也迈入到了智能时代。在电力设备的故障诊断、用电预测以及节能减排等问题的研究中,传统的分类、聚类、关联规则等数据挖掘算法都已发挥出重要的作用,并且也取得了不错的效果。但是随着实际应用的不断扩展,传统的数据挖掘方法可能会面临诸多问题,通常情况下,一般的数据挖掘算法都会要求数据源足够充分,而当源领域数据较为稀疏时,一般的数据挖掘算法通常会由于欠拟合的问题很难取得理想的效果。作为一种新兴的机器学习方法,近年来,迁移学习在数据的挖掘分析中已经取得了一定的成果。迁移学习旨在研究不同分布的数据之间的耦合问题,从实际需求出发,选择较为充足的数据源作为迁移学习的源领域,待分析的数据作为目标领域,将源领域中训练出的学习规则应用在目标领域中,以在目标领域中获取更高的起点以及更加精确的数据分析规则。因此,将迁移学习方法应用到稀疏的电力数据中具有极高的实际意义。根据源领域和目标领域之间数据分布的差异,可以将迁移学习分为基于实例的迁移学习方法和基于特征的迁移学习方法。本文从这两个方面出发,完成了以下几个方面的工作。首先,针对现有的迁移学习算法trAdaboost算法中错误率可能收敛过快等问题,本文提出了对trAdaboost算法的改进以及并行化处理,并将改进后的模型应用于变压器设备数据中,完成了负载预测的工作。其次,通过对基于特征的迁移学习算法的研究,本文提出并实现了一种基于平衡领域适应的深度迁移网络模型,并将提出的模型应用到电力数据中,完成了变压器以及开关的故障预测工作。最后,通过对大数据分析平台的集成方法的相关研究,完成了以上两个迁移学习算法在平台中的集成工作。