论文部分内容阅读
企业数据仓库的数据设计是一个结合应用到多种技术和设计方法的复杂而长期完善的过程,是构建企业数据仓库最关键的部分。数据设计的质量决定了数据仓库所能够进行的分析的类型、分析的细节程度、分析的效率以及响应时间。可以说,数据仓库数据模型的设计决定企业数据仓库的成败。首先,本文对企业数据仓库的数据设计构架提出了一个整体的设计方案和数据设计流程。采用结合逻辑驱动和物理驱动的混合数据建模方法,对数据模型的生成、增量改变的管理提出设计方案,在采用增量迭代式开发方法基础上,使接口文件到模型的映射,ETL设计及ETL构建过程并行进行提高模型的开发速度。采用双数据管道区、双层结构的数据登台区等有效措施提升企业数据仓库的性能,降低设计的复杂性,提高可维护性。其次,本文在提出数据集市的整体数据构架和数据模型设计流程的基础上,对维度数据模型进行设计和构建。对数据集市的数据设计及维度建模的一些关键设计(如异构产品维模型、缓慢变化维、钻透性查询等)提出了有效的解决方法,并设计完整的数据集市的维度数据模型,对数据模型提出有效的优化方法。本文针对银行企业数据仓库的元数据的分类和特点,提出了银行企业数据仓库元数据设计与实现的解决方案,包括详细的设计、数据抽取、实现和应用展示。银行企业数据仓库项目的成功投入使用证明本文的设计有实际应用价值。