论文部分内容阅读
摘要:
本文介绍了浙江省电力公司目前实施的数据仓库系统SAPBW的情况,重点介绍了浙江电力BW系统的建设背景、框架设计及数据模型举例,并简单分析了数据仓库系统建设对浙江电力ERP系统建设及发展起到的作用。
关键词:
数据仓库 数据模型
1、系统建设背景
浙江省电力公司自1996年起步,采用SAP公司成熟的应用软件SAP系统,开始建设企业级ERP系统,至今已经有近十年的时间了。目前已经正式投入运行的应用模块包括:财务管理(FI)、会计管理(CO)、物资管理(MM)、项目管理(Ps)、人力资源管理(HR)、生产管理(PM)等。这些模块都得到了广泛的实施和应用,其中财务凭证超过了580万张、物料主数据近10万条、通过PS模块管理的项目超过3万、设备主数据超过90万条、人力资源管理中的组织单元设置也超过了2千个。可以说:通过这些年ERP系统的实施,已经在浙江电力内部积累了大量的基础数据。
但是,由于这些模块的主要使用者是基层业务人员,基础数据随着时间的变迁也逐步散落在系统中,对企业的高层决策、趋势分析很难发挥作用。这就造成了系统中存在大量数据但信息贫乏(DataRich-InformationPoor)的局面。
因此,2005年6月浙江电力果断决定启动数据仓库项目,在全省范围内构架统一的数据仓库,规范基础数据及关键数据模型,通过信息系统的规划,实现内部管理和业务语言的统一,方便信息集成。
2、数据仓库的基本体系架构设计
2.1 数据仓库的原理
数据仓库是对数据进行提炼、加工和集成含有一定量商务信息和意义的信息。数据仓库不是为了存储数据,而是为更好地利用企业内所有可能收集到的数据,以提供决策支持。
数据仓库拥有以下四个特点:
(1) 面向主题
在数据仓库中,数据被分类,并按业务数据主题的视角对数据进行存贮。而在OLTP(业务处理系统)中,数据是按业务应用的视角进行组织和存贮。
(2) 集成的
某个业务主题所包括的数据不会存贮在多个业务主题中。即某数据如果属于业务主题A,则不应该同时属于业务主题B。
(3) 具有时间特征
存贮在数据仓库中的数据,均表示在某一时间点上所发生的事实,所以数据仓库的数据大部分都与时间相关,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
(4)相对稳定的
一般情况下,数据仓库中的数据不会被更改或删除。
2.2 数据仓库系统的四层体系结构
整个数据仓库系统是一个包含四个层次的体系结构;
数据源:是数据仓库系统的基础,是整个系统数据的源泉。通常包括企业内部信息和外部信息。
数据存储与管理:是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据;数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。
OLAP服务器:对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,从中归纳出数据的变化及趋势。
前端工具与应用:前端工具包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库开发的应用。
应该认识到:数据仓库不仅仅只是存放数据的载体,它还包括按业务要求对业务系统数据进行整合处理的方法和流程,并构建在数据仓库的分析应用。
3、浙江电力数据仓库系统简介
3.1 系统现状
浙江电力的数据仓库系统采用了SAPBW产品,它是SAPNetWeaver平台的组成部分。SAPBW与SAPR/3产品紧密集成,可以基于大量现成的业务模板(BCT)建立企业关键绩效指标KPI的分析模型,将大量业务数据进行汇总分析,考核企业KPI的运作情况,侧重于高层管理分析。在进行系统规划时,就将Bw定位于整个企业的统一数据仓库平台,以省公司为核心、以两至三家单位为试点、所有下属单位统一应用实施;在业务逻辑上,以SAPR/3的业务数据为核心,以此为基础来整合所有的业务系统数据。BW系统的实施过程采用了SAP公司的ASAP实施方法论,整个系统的建设体现出循序渐进、螺旋式上升、不断充实、不断完善的过程。
到目前为止,浙江电力SAPBW系统已经实现了对SAPR/3系统中FI、CO、MM、HR、PS等多个模块的数据整合,也完成了部分非SAPR/3系统的数据整合,例如:Hyperion预算系统、投资管理系统、远光报表系统、营销月报等。
3.2 主要模型举例
SAPBw系统能够向用户提供对来自不同系统业务信息的动态查询和多维度分析,帮助领导及管理人员对企业重要业务运营情况进行趋势报警,同时还能帮助业务人员自己灵活地定义报表,提高业务数据的利用率。 这里仅以项目成本分析为例。项目成本分析的数据模型为信息立方体,星型结构图如图3:
从图3可以看出:围绕项目成本的金额、数量,有八个维度可以提供分析。其中时间、单位是BW系统的保留维度(即必须的),其他六个都是根据业务需求对不同的业务信息进行分类得到的。其中项目信息维度在具体报表的展现中会结合项目主数据来增强分析功能,这样所有项目主数据的属性都可以用来分析。这个模型的数据全部来源于SAPR3系统,BW系统用两个ODS来保证项目的预算数据和各个计划版本数据与源系统数据的一致性。 (项目主数据中的数据除了来源于R/3系统外,还有来自非SAP的投资管理系统。)
基于上述模型不同分析对象不同取值的组合,我们可以很容易得到项目预算值、各个版本的概算值和实际发生的成本,并且根据各个分析维度进行横向和纵向的分析。
3.3 功能展示
目前BW采用的数据展现方式主要两种,一种是BW系统提供的BExAnalyzer,它是加载在MicrosoftExcel中的宏,对业务人员来说,使用起来非常方便,还可以灵活地自定义报表;另一种是集成在企业门户中,通过浏览器的方式,集中展现给决策层、管理层使用,领导只需要掌握简单的几个操作,就可以对各类业务信息进行分析、查询。
浙江电力通过两年的数据仓库(BW)系统的实施,初步打破了已有各个业务系统之间的壁垒,构建了统一的数据仓库平台,规范了主要业务数据的定义,提供了高可用的跨系统平台、跨业务模块的信息综合分析和二次展现。
到目前为止,浙江电力已经完成人、财、物、基建项目等信息的整合。通过BW系统提供的各类报表和模板,企业各级用户可以实时地查询到企业最新的现金分布情况、大额现金流入流出情况,可以准确地做出付款资金的预测,可以动态地查询到各地库存的分布情况和采购完成情况,可以对各个供应商的供货情况进行纵向、横向的比较,可以灵活地对企业各个岗位变化情况进行分析、得到最佳的人员配备标准,也可以清楚地了解到各个项目的资金到位情况、投资完成情况、实际进度,帮助领导掌握项目动向。同时,也实现了企业内部审计从“事后审计”向“实时审计”转变,进一步提高了企业的管理水平。
本文介绍了浙江省电力公司目前实施的数据仓库系统SAPBW的情况,重点介绍了浙江电力BW系统的建设背景、框架设计及数据模型举例,并简单分析了数据仓库系统建设对浙江电力ERP系统建设及发展起到的作用。
关键词:
数据仓库 数据模型
1、系统建设背景
浙江省电力公司自1996年起步,采用SAP公司成熟的应用软件SAP系统,开始建设企业级ERP系统,至今已经有近十年的时间了。目前已经正式投入运行的应用模块包括:财务管理(FI)、会计管理(CO)、物资管理(MM)、项目管理(Ps)、人力资源管理(HR)、生产管理(PM)等。这些模块都得到了广泛的实施和应用,其中财务凭证超过了580万张、物料主数据近10万条、通过PS模块管理的项目超过3万、设备主数据超过90万条、人力资源管理中的组织单元设置也超过了2千个。可以说:通过这些年ERP系统的实施,已经在浙江电力内部积累了大量的基础数据。
但是,由于这些模块的主要使用者是基层业务人员,基础数据随着时间的变迁也逐步散落在系统中,对企业的高层决策、趋势分析很难发挥作用。这就造成了系统中存在大量数据但信息贫乏(DataRich-InformationPoor)的局面。
因此,2005年6月浙江电力果断决定启动数据仓库项目,在全省范围内构架统一的数据仓库,规范基础数据及关键数据模型,通过信息系统的规划,实现内部管理和业务语言的统一,方便信息集成。
2、数据仓库的基本体系架构设计
2.1 数据仓库的原理
数据仓库是对数据进行提炼、加工和集成含有一定量商务信息和意义的信息。数据仓库不是为了存储数据,而是为更好地利用企业内所有可能收集到的数据,以提供决策支持。
数据仓库拥有以下四个特点:
(1) 面向主题
在数据仓库中,数据被分类,并按业务数据主题的视角对数据进行存贮。而在OLTP(业务处理系统)中,数据是按业务应用的视角进行组织和存贮。
(2) 集成的
某个业务主题所包括的数据不会存贮在多个业务主题中。即某数据如果属于业务主题A,则不应该同时属于业务主题B。
(3) 具有时间特征
存贮在数据仓库中的数据,均表示在某一时间点上所发生的事实,所以数据仓库的数据大部分都与时间相关,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
(4)相对稳定的
一般情况下,数据仓库中的数据不会被更改或删除。
2.2 数据仓库系统的四层体系结构
整个数据仓库系统是一个包含四个层次的体系结构;
数据源:是数据仓库系统的基础,是整个系统数据的源泉。通常包括企业内部信息和外部信息。
数据存储与管理:是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据;数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。
OLAP服务器:对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,从中归纳出数据的变化及趋势。
前端工具与应用:前端工具包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库开发的应用。
应该认识到:数据仓库不仅仅只是存放数据的载体,它还包括按业务要求对业务系统数据进行整合处理的方法和流程,并构建在数据仓库的分析应用。
3、浙江电力数据仓库系统简介
3.1 系统现状
浙江电力的数据仓库系统采用了SAPBW产品,它是SAPNetWeaver平台的组成部分。SAPBW与SAPR/3产品紧密集成,可以基于大量现成的业务模板(BCT)建立企业关键绩效指标KPI的分析模型,将大量业务数据进行汇总分析,考核企业KPI的运作情况,侧重于高层管理分析。在进行系统规划时,就将Bw定位于整个企业的统一数据仓库平台,以省公司为核心、以两至三家单位为试点、所有下属单位统一应用实施;在业务逻辑上,以SAPR/3的业务数据为核心,以此为基础来整合所有的业务系统数据。BW系统的实施过程采用了SAP公司的ASAP实施方法论,整个系统的建设体现出循序渐进、螺旋式上升、不断充实、不断完善的过程。
到目前为止,浙江电力SAPBW系统已经实现了对SAPR/3系统中FI、CO、MM、HR、PS等多个模块的数据整合,也完成了部分非SAPR/3系统的数据整合,例如:Hyperion预算系统、投资管理系统、远光报表系统、营销月报等。
3.2 主要模型举例
SAPBw系统能够向用户提供对来自不同系统业务信息的动态查询和多维度分析,帮助领导及管理人员对企业重要业务运营情况进行趋势报警,同时还能帮助业务人员自己灵活地定义报表,提高业务数据的利用率。 这里仅以项目成本分析为例。项目成本分析的数据模型为信息立方体,星型结构图如图3:
从图3可以看出:围绕项目成本的金额、数量,有八个维度可以提供分析。其中时间、单位是BW系统的保留维度(即必须的),其他六个都是根据业务需求对不同的业务信息进行分类得到的。其中项目信息维度在具体报表的展现中会结合项目主数据来增强分析功能,这样所有项目主数据的属性都可以用来分析。这个模型的数据全部来源于SAPR3系统,BW系统用两个ODS来保证项目的预算数据和各个计划版本数据与源系统数据的一致性。 (项目主数据中的数据除了来源于R/3系统外,还有来自非SAP的投资管理系统。)
基于上述模型不同分析对象不同取值的组合,我们可以很容易得到项目预算值、各个版本的概算值和实际发生的成本,并且根据各个分析维度进行横向和纵向的分析。
3.3 功能展示
目前BW采用的数据展现方式主要两种,一种是BW系统提供的BExAnalyzer,它是加载在MicrosoftExcel中的宏,对业务人员来说,使用起来非常方便,还可以灵活地自定义报表;另一种是集成在企业门户中,通过浏览器的方式,集中展现给决策层、管理层使用,领导只需要掌握简单的几个操作,就可以对各类业务信息进行分析、查询。
浙江电力通过两年的数据仓库(BW)系统的实施,初步打破了已有各个业务系统之间的壁垒,构建了统一的数据仓库平台,规范了主要业务数据的定义,提供了高可用的跨系统平台、跨业务模块的信息综合分析和二次展现。
到目前为止,浙江电力已经完成人、财、物、基建项目等信息的整合。通过BW系统提供的各类报表和模板,企业各级用户可以实时地查询到企业最新的现金分布情况、大额现金流入流出情况,可以准确地做出付款资金的预测,可以动态地查询到各地库存的分布情况和采购完成情况,可以对各个供应商的供货情况进行纵向、横向的比较,可以灵活地对企业各个岗位变化情况进行分析、得到最佳的人员配备标准,也可以清楚地了解到各个项目的资金到位情况、投资完成情况、实际进度,帮助领导掌握项目动向。同时,也实现了企业内部审计从“事后审计”向“实时审计”转变,进一步提高了企业的管理水平。