论文部分内容阅读
随着我国金融业的飞速发展,银行已经进入到以客户为中心、面向管理效益、以信息技术创意为主要特征的发展阶段。数据仓库是管理信息和分析应用最有效的方式,数据仓库技术与其他软件的有机结合,可以有效地为金融企业进行风险管理、绩效评估、盈利分析和客户关系管理。 本文在对国内外银行数据仓库的应用现状进行了深入论述和分析的基础之上,结合深圳发展银行实际,给出了一套数据仓库系统建设的总体设计方案,并对方法和实现进行了探讨。 深圳发展银行数据仓库的建设目标是:建立一个涵盖深圳发展银行全部核心业务信息、管理信息以及有关外部信息的完备的信息仓库。为全行各级管理、业务人员提供信息查询、动态报表生成、多维数据分析和数据挖掘等服务。 整个数据仓库系统采用了总分结合的建设模式,在总行设立总行级数据仓库,在分行设立分行级数据仓库。该模式能较好满足全行各级管理部门决策支持需要,适合银行现在总分行制的组织形式。数据仓库系统的整体构架由数据仓库、数据聚集、数据展示三部分组成。 1)数据仓库是系统的核心,我们采取了数据仓库总线模型架构。该架构的优点在于数据仓库开发团队可以按照总线规范异步地独立地建立各个数据集市,可以缩短建设周期和费用,又具有良好的一致性和可扩展性。数据建模是数据仓库实施中的重要一环,分为逻辑建模和物理建模。 在逻辑建模部分,由于维度模型比实体关系模型有着诸多优点,因此我们采取维度模型作为数据仓库的建模方法。本文对银行数据仓库维度模型进行了详细设计。首先给出了银行业数据仓库的总线模型矩阵,定义了数据仓库的一致性维度与数据集市。然后,对存款业务分析数据集市进行了详细的维度建模,最后讨论了建模过程的慢速变化维、代理关键字、避免雪花处理等关键问题。 针对数据仓库物理模型的设计,本文基于ORACLE数据库讨论了数据仓库的分区策略和索引策略。数据仓库中事实表一般都为超大型表,我们采取了ORACLE8i提供的分区功能,解决了超大型表的管理问题;数据仓库是以查询为中心的,因此一个可靠的索引策略会带来巨大的收益,本文讨论了数据仓库维表和事实表的索引原则并给出银行数据仓库的索引计划表。 2)数据聚集部分包括数据的数据抽取、转换和加载(ETL)。在抽取环节,