论文部分内容阅读
数据仓库技术就是以决策支持为最终目标的技术,它主要是通过对过去若干月份的数据积累,使用联机分析处理技术(Online Analytical Processing,简称OLAP)技术来回答目前经营中究竟发生了什么情况,运用数据挖掘来预测企业将来可能要发生什么情形。它作为一种新兴技术,在数据处理量极大的行业中,例如电信业、银行业等中,已经获得了广泛的使用。以电信业为例,目前中国主要有五大电信运营商,每一家都期望能够独占相应产品的市场份额,于是五大运营商都建立了自己的数据仓库,但是到目前为止能够紧密结合电信业务辅助决策,取得成功的案例几乎没有。而本文以“河南联通的经营分析系统”为研究背景,通过在河南联通经营分析数据仓库搭建及实施过程中解决的种种问题,对数据仓库进行了系统体系结构和其中OLAP部分实现进行了深入研究,探讨了在中国目前的电信运营环境下,利用何种体系结构才能够使得数据仓库更成功,以及如何让数据仓库更好的服务于联机分析处理OLAP报表的创建。 论文首先对数据仓库技术及OLAP技术进行了系统的阐述,主要介绍了数据仓库的概念及四大特点,以及联机分析处理OLAP技术和多维数据库的基本概念。主要是为论文中讨论的议题进行知识的准备。 其次,结合“河南联通经营分析系统”,详细讨论了在目前这种电信经营环境下,传统数据仓库结构的不足,并给出了一种新的、增加了一层操作型数据存储(Operational Data Store,简称ODS)的数据仓库结构的解决方案,分析ODS层带来的好处,及其主要解决的问题。并通过给出“河南联通经营分析系统”数据仓库的数据库结构图详细说明了ODS层在整个数据仓库中数据转换、清洗中心,及上承数据仓库、下启各种数据来源的作用和地位。 再次结合“河南联通经营分析系统”中的OLAP具体应用,讨论了ODS带来的好处。OLAP中如何高效借助数据仓库生成报表一直是一个难题,这一部分还