论文部分内容阅读
经过多年的信息化之后,很多机构都积累了大量的历史数据,这些数据往往被闲置起来,没有的到充分的利用;另外人们对计算机的数据处理能力也提出了更高的需求,不再满足于传统的事务型处理,而提出了分析型处理需求。于是在20世纪80年代,在管理信息系统的基础上,发展了决策支持系统去处理大量的历史数据,满足人们的分析型需求。决策支持系统的基础是大量良好管理的数据。为了管理好这些数据,产生和发展了数据仓库系统。数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。数据仓库中存放的是整个企业的数据,并且按照不同的主题加以组织,为了减少数据处理量,使信息的利用更快捷、灵活,我们将数据仓库中面向企业的某个部门(主题)的数据子集,在逻辑上或物理上划分出来,称之为数据集市。
本文就是依据东北大学信息学院的决策分析需求,设计和实施了一个学院级数据集市及其在办公自动化系统中的应用。系统阐述了数据仓库技术在高等教育领域的初步应用,并且深入研究了其中的关键问题。
具体地,本文按照业务维生命周期法从项目规划开始,首先确定本数据仓库项目的定义和范围,彻底了解最终用户的业务需求,确定系统所需的数据、实现的功能以及用户界面等。然后,展开数据集市的逻辑设计的讨论,将基于用户分析需求和基于业务数据模型这两种维度建模方法加以分析和比较,结合二者的优点提出了兼顾用户业务需求与底层数据的R&D方法,从而得到了更能满足客户需求的、更具可扩展性的维度模型。接着,我们讨论了系统的物理模型的设计,从数据的存储结构、索引策略、存储策略等角度去优化系统的性能。对于数据仓库建立的核心过程ETL,我们也着重进行了阐述,提出一套手工编码实现的ETL加载方案,并分成初始加载方案、增量加载方案和特例加载方案分别加以论述。最后,我们简单介绍了基于数据集市的OLAP应用的设计及其原型系统的实现效果。