论文部分内容阅读
据统计,一个组织的数据量每5年翻一番,如何管理这些庞杂的数据并使之用于决策支持就成为每个组织的迫切要求。数据仓库(Data Warehouse)技术就是在这样的要求下产生并发展起来的一个研究领域。它将多种异质异构的数据源集成综合在一起,形成一个统一的信息平台。它是一种公认的解决企业虽拥有大量数据却难以及时有效的提取决策所需信息的有效途径。 元数据(Meta Date)是数据仓库的一个重要的组成部分,是联系数据仓库中各部分的纽带。它作用于数据仓库的创建、维护、管理和使用的各个方面。然而在实际应用中,一个企业通常存在多个不同的数据集市系统,而每一个系统又使用着多个不同的数据仓库和在线分析工具,各系统和各工具中元数据的数据格式、数据模型和使用方法等都不一致,形成了元数据分立的局面,严重阻碍了数据仓库的有效利用。解决元数据集成的问题,正成为诸多组织和研究机构的研究热点。 本文主要介绍了元数据的有关内容,提出了一种解决元数据集成的方案。并讨论元数据管理策略和元数据集成体系结构。最后,运用Rational的Rose建模工具对电信数据仓库建模和设计ETL工具使数据从数据源经过抽取、转换和装载在元数据的管理之下集成到数据仓库里。