论文部分内容阅读
数据仓库技术是近年来出现的、发展迅速的一项技术。它可以充分利用存储于数据仓库中的信息,帮助企业领导进行正确的决策,使企业能在激烈的市场竞争中把握先机。高质量的分析数据是企业领导能够了解企业经营状况、修改制定企业经营策略、做出长远决策的重要依据。因此数据仓库的建设对企业决策来说显得尤为重要。
本文针对中国五矿集团对进出口数据的多维分析和决策支持需求,对海关及商务部EDI(电子商务中心)的数据组织和展现进行了研究和实现,详细讨论了中国五矿集团的进出口数据仓库环境和数据分析系统的设计和实现过程。首先通过分析数据仓库的定义、特性和体系结构,阐述了基于数据仓库生命周期的建模思想和方法,对数据源、数据仓库结构设计、OLAP体系结构方案以及前端工具的选择进行了分析,提出了五矿集团进出口数据仓库的总体结构;然后通过对进出口数据进行分析,划分了相应的业务主题,对数据仓库的进行概念、逻辑和物理模型设计;接着重点讨论了一种基于CWM元数据的ETL工具的实现方法以及对集团公司的各种数据源进行抽取、转换、清洗和向数据仓库系统中的装载;最后重点讨论了对进出口数据仓库的分析和展现的设计过程。对数据的物理视图采取了分析报表和固定报表两种方式,支持钻取、旋转等多维操作。对集团公司的进出口情况进行了系统的多角度分析,为决策支持提供依据。
通过本系统,业务数据及相关数据能够按主题在数据仓库环境中进行稳定、一致的组织和存储;同时根据用户的分析需求,实现ETL的转换、加载,构建相应的数据立方体,并传送给用户;最后,多维数据在客户端以分析报表或固定报表的方式进行展现和操作。从而完成了数据从按主题存储组织到分析展现的整个过程。本系统使最终用户使用的数据不仅在效率上,而且在准确度上都有了很大的提高,并且系统具有良好的扩展性,为企业信息化建设的进一步发展奠定了良好的基础。