论文部分内容阅读
【摘要】每一家企业都有自己的数据,并且在计算机系统中储存有大量的数据,记录着企业购买、销售、生产过程中的大量信息和客户的信息。通常这些数据都储存在许多不同的地方。使用数据仓库之后,企业将所有收集来的信息存放在一个唯一的地方——数据仓库。在本文中本人通过财务管理决策系统设计把数据仓库的技术引入进来,依次从概念模型的设计、逻辑模型设计、物理模型设计、数据仓库生成几个步骤来实现数据仓库。
关键词:数据仓库,信息,数据库
数据仓库的概念最初是美国信息工程学家WilliamInmon博士90年代提出的,他认为:“一个数据仓库通常是一个面向主题的、集成的及随时间变化的,但信息本身又相对稳定的数据集合,它用于对管理决策过程的支持。”所谓主题,在这里是指用户使用数据仓库进行决策时所关心的重点方面,如银行存款情况、贷款情况、客户群情况、利润情况等;面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息;集成是指数据仓库中的信息不是从各个业务处理系统简单抽取出来的,而是经过系统加工、汇总和整理的,保证数据仓库内的信息是关于整个企业的一致的全局信息;随时间变化则是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势作出定量分析和预测。
随着数据量日益增大,最后变为一座庞大的“数据矿藏”是所有计算机事务处理系统最终都会遇到的情况。面对如此巨大的“矿藏”,如果不能充分的发掘,加以利用,是一件很可惜的事,而数据仓库就是一种帮助用户从“数据矿藏”中挖掘信息“金块”的技术。数据仓库技术在财务工作中,从财务各部门将有用数据提取出来,经过数据抽取、清洗、转换,建立起一个数据集市或数据仓库,并利用其进行分析预测,从而为财务决策服务的过程。
近年来,数据仓库技术在信息系统的建设中得到了广泛应用,有效地为决策提供了支持。本人所在单位组织开发了财务管理决策系统,该系统主要针对本单位的实习厂生产的产品流通情况,使高层领导掌握实习厂的生产经营状况及进、销、存情况,分析市场趋势。
本文通过对财务数据的分析,结合数据仓库开发原理,完成对财务数据仓库的数据组织,介绍了财务数据仓库的设计和实现方法。财务数据仓库的设计步骤主要是遵循数据库设计的过程,分为概念模型的设计、逻辑模型设计、物理模型设计和数据仓库生成等几个阶段。
在这个系统的设计过程中,我们遵循了数据库设计的过程,整个财务数据仓库的设计步骤如下:
(1)概念模型的设计;
(2)逻辑模型设计;
(3)物理模型设计;
(4)数据仓库生成。
1.概念模型的设计
概念设计所要完成的主要工作有:对于数据仓库系统而言,决策者最为迫切的需求在于更加准确的掌握企业的经营状况及进、销、存情况,包括分析进货趋势,分析销售市场波动趋势,分析企业存货情况,分析市场经营状况发展趋势。所要求的操作数据库的数据有商品进货数据、商品销售数据、商品库存数据、顾客信息和销售商信息。
2.逻辑模型设计
确定系统的主题域及内容在上述需求分析的基础之上,我们可以确定企业财务仓库系统的3个主题,分别是商品、顾客和销售商。商品、顾客、销售商是财务数据仓库的3个主题,是其经营运作3个框架。商品主题描述企业商品分类及销售情况;顾客主题描述了企业对顾客进行分类及有关顾客合同的管理情况;销售商主要描述了企业销售人员销售商品及销售地区情况。其中商品主要作为中心,将这3个主题联系起来。
以“商品”为主题可以看到,首先,在从面向应用到面向主题的转变过程中,丢弃了原来不必要、不适合分析的信息,如各类领料单、出库单、入库单等;在原有数据库模式中,有关商品的信息被分散在各个子系统中,如:商品销售信息存放于数据管理子系统,商品库存信息存放于商品库管理子系统中等,根本没有形成一个有关商品的完整一致的描述。而向主题的数据组织形式所实现的就是要形成商品一致的信息集合,以便在此基础上针对“商品”这一分析对象进行分析处理。
3.物理模型设计
通过定义功能/数据的交叉参照图,决定谁需要访问哪个范围的数据。每个数据仓库实施的最初阶段,必须标明最终用户的词汇表,定义恰当的商业术语,与底层数据联系起来。由于数据仓库本身通常是面向主观意识的,基于最终用户的需求,创建数据仓库的第一步是识别和分析有关的内部数据和外部数据源。数据模型在将内部和外部操作数据转换和集成到数据仓库里的过程中起着关键性的作用。在这个阶段,系统分析师必须收集信息,实施从数据源到数据模型的逻辑转换,确定数据按简要或详细的程度保存在数据仓库中。从长远的角度优化数据仓库,系统必须是灵活的,可扩充的,模块化的,以便有足够的能力去适应系统的不断增长。
4.数据仓库的实现
在财务数据仓库中有几种方式:菜单式、问答式和图形式。数据仓库的工作就是将数据采集到数据仓库中。数据采集是将原始数据从多个传统事务处理数据库系统中提取出来进行清理、集成等有关处理,使之符合数据仓库环境中对数据质量的要求后再装载入数据仓库中。
数据采集的主要工作有确定数据源的顺序、元数据的管理、数据分割和数据的定期维护。数据在装入数据仓库底层的目标数据库后,还要完成的任务包括数据的定期清理、刷新、重建索引、初步划分主题等工作。
数据仓库技术的发展包括数据抽取,存储管理,数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化。它将互连、转换、复制、调度、监控纳入标准化的统一管理、以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。
在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。
在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,同时与Internet/Web技术紧密结合,推出适用于Intranet和终端免维护的数据仓库访问前端。
数据仓库实现过程的方法论将成为数据库设计的一个明确分支,并将成为管理信息系统设计的必备。
数据仓库是一个复杂的信息集成工程,需要有事先周密的规划。通过对数据仓库工程进行规划,要明确业务信息需求和现状,提出如何通过采用相应技术,实施可行的工程化步骤,达到工程项目的预期目标。
关键词:数据仓库,信息,数据库
数据仓库的概念最初是美国信息工程学家WilliamInmon博士90年代提出的,他认为:“一个数据仓库通常是一个面向主题的、集成的及随时间变化的,但信息本身又相对稳定的数据集合,它用于对管理决策过程的支持。”所谓主题,在这里是指用户使用数据仓库进行决策时所关心的重点方面,如银行存款情况、贷款情况、客户群情况、利润情况等;面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息;集成是指数据仓库中的信息不是从各个业务处理系统简单抽取出来的,而是经过系统加工、汇总和整理的,保证数据仓库内的信息是关于整个企业的一致的全局信息;随时间变化则是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势作出定量分析和预测。
随着数据量日益增大,最后变为一座庞大的“数据矿藏”是所有计算机事务处理系统最终都会遇到的情况。面对如此巨大的“矿藏”,如果不能充分的发掘,加以利用,是一件很可惜的事,而数据仓库就是一种帮助用户从“数据矿藏”中挖掘信息“金块”的技术。数据仓库技术在财务工作中,从财务各部门将有用数据提取出来,经过数据抽取、清洗、转换,建立起一个数据集市或数据仓库,并利用其进行分析预测,从而为财务决策服务的过程。
近年来,数据仓库技术在信息系统的建设中得到了广泛应用,有效地为决策提供了支持。本人所在单位组织开发了财务管理决策系统,该系统主要针对本单位的实习厂生产的产品流通情况,使高层领导掌握实习厂的生产经营状况及进、销、存情况,分析市场趋势。
本文通过对财务数据的分析,结合数据仓库开发原理,完成对财务数据仓库的数据组织,介绍了财务数据仓库的设计和实现方法。财务数据仓库的设计步骤主要是遵循数据库设计的过程,分为概念模型的设计、逻辑模型设计、物理模型设计和数据仓库生成等几个阶段。
在这个系统的设计过程中,我们遵循了数据库设计的过程,整个财务数据仓库的设计步骤如下:
(1)概念模型的设计;
(2)逻辑模型设计;
(3)物理模型设计;
(4)数据仓库生成。
1.概念模型的设计
概念设计所要完成的主要工作有:对于数据仓库系统而言,决策者最为迫切的需求在于更加准确的掌握企业的经营状况及进、销、存情况,包括分析进货趋势,分析销售市场波动趋势,分析企业存货情况,分析市场经营状况发展趋势。所要求的操作数据库的数据有商品进货数据、商品销售数据、商品库存数据、顾客信息和销售商信息。
2.逻辑模型设计
确定系统的主题域及内容在上述需求分析的基础之上,我们可以确定企业财务仓库系统的3个主题,分别是商品、顾客和销售商。商品、顾客、销售商是财务数据仓库的3个主题,是其经营运作3个框架。商品主题描述企业商品分类及销售情况;顾客主题描述了企业对顾客进行分类及有关顾客合同的管理情况;销售商主要描述了企业销售人员销售商品及销售地区情况。其中商品主要作为中心,将这3个主题联系起来。
以“商品”为主题可以看到,首先,在从面向应用到面向主题的转变过程中,丢弃了原来不必要、不适合分析的信息,如各类领料单、出库单、入库单等;在原有数据库模式中,有关商品的信息被分散在各个子系统中,如:商品销售信息存放于数据管理子系统,商品库存信息存放于商品库管理子系统中等,根本没有形成一个有关商品的完整一致的描述。而向主题的数据组织形式所实现的就是要形成商品一致的信息集合,以便在此基础上针对“商品”这一分析对象进行分析处理。
3.物理模型设计
通过定义功能/数据的交叉参照图,决定谁需要访问哪个范围的数据。每个数据仓库实施的最初阶段,必须标明最终用户的词汇表,定义恰当的商业术语,与底层数据联系起来。由于数据仓库本身通常是面向主观意识的,基于最终用户的需求,创建数据仓库的第一步是识别和分析有关的内部数据和外部数据源。数据模型在将内部和外部操作数据转换和集成到数据仓库里的过程中起着关键性的作用。在这个阶段,系统分析师必须收集信息,实施从数据源到数据模型的逻辑转换,确定数据按简要或详细的程度保存在数据仓库中。从长远的角度优化数据仓库,系统必须是灵活的,可扩充的,模块化的,以便有足够的能力去适应系统的不断增长。
4.数据仓库的实现
在财务数据仓库中有几种方式:菜单式、问答式和图形式。数据仓库的工作就是将数据采集到数据仓库中。数据采集是将原始数据从多个传统事务处理数据库系统中提取出来进行清理、集成等有关处理,使之符合数据仓库环境中对数据质量的要求后再装载入数据仓库中。
数据采集的主要工作有确定数据源的顺序、元数据的管理、数据分割和数据的定期维护。数据在装入数据仓库底层的目标数据库后,还要完成的任务包括数据的定期清理、刷新、重建索引、初步划分主题等工作。
数据仓库技术的发展包括数据抽取,存储管理,数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化。它将互连、转换、复制、调度、监控纳入标准化的统一管理、以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。
在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。
在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,同时与Internet/Web技术紧密结合,推出适用于Intranet和终端免维护的数据仓库访问前端。
数据仓库实现过程的方法论将成为数据库设计的一个明确分支,并将成为管理信息系统设计的必备。
数据仓库是一个复杂的信息集成工程,需要有事先周密的规划。通过对数据仓库工程进行规划,要明确业务信息需求和现状,提出如何通过采用相应技术,实施可行的工程化步骤,达到工程项目的预期目标。