论文部分内容阅读
随着电网技术的不断发展以及企业信息化的普及,电网运行和变电站信息管理系统每天都会产生大量的数据,这些数据大量的积累,并呈现信息爆炸的趋势,使企业陷入了“数据丰富,而信息匮乏”的尴尬境地。经过接近一年在邹城市供电公司的调查实习工作,逐渐的发现了很多相关的问题,例如,每次变电站发生跳闸事故,都要组织专门的小组对保护及安全监控装置给出的大量的数据进行分析处理,极为耗时,很容易耽误事故处理。便萌生了利用所学的数据挖掘和OLAP的知识,简化人工的劳动量,提高电力企业对于事故的分析处理能力,进而提高电力企业对于紧急事故的应对能力,保障电网的安全运行的想法。本文的主要工作是构建一个基于数据挖掘的电力企业联机分析处理系统,对邹城市供电公司大量的业务逻辑数据按照调整后的CRISP-DM数据挖掘的过程,对数据进行业务理解、数据理解、数据粗粒度处理、按主题需求建模、通过数据ETL建立数据仓库,然后对数据仓库按照主题不同分别构建电网故障分析与预测和电网负载平衡分析的分析模型,并应用OLAP分析工具进行多维分析,发现隐含的、不容易被发现的规律或数据间的关联性。本文主要工作流程是,首先按照数据挖掘的基本原理,通过对邹城市供电公司业务逻辑数据库的现状分析,对系统进行需求分析,确定主题域,通过业务理解和数据理解确定支持决策的数据来源,明确数据仓库的成功标准和关键性能指标,运用Microsoft SQL Server 2005对邹城市供电公司所辖的20个变电站的业务逻辑数据按照其后台机软件平台和数据库管理软件的不同而采取不同的措施,通过对数据进行粗粒度处理,完成构建数据仓库的前期准备。然后按照需求的不同构建相应的星型模型,通过数据‘ETL建立数据仓库,对于电网故障分析与预测和电网负载平衡分析方面的需求,通过划分维度和度量值来建立多维数据分析模型,并通过Microsoft Analysis Services数据库分析组件中的MDX来对数据仓库进行智能的OLAP分析处理。最后给出总结,指出本文的缺点和不足,并对今后的工作提出改进意见。