论文部分内容阅读
本文首先简要介绍了ETL工具的基本概念和ETL工具的三个核心问题:数据的抽取、数据的转换和数据的装载,然后深入细致地分析了国内外流行的ETL工具的功能特色,并讨论了目前数据仓库系统中ETL工具的应用问题。最后,本文采用Java语言、AS/400系统上特有的RPG语言和SQL语言以及移动Agent技术开发了一个应用于数据仓库系统的ETL工具。本文重点讨论了该工具的设计和实现。
本ETL工具采用了ETL过程定义和过程执行分开的体系结构,支持用户自定义数据的处理方式,支持用户任意的扩展工具的功能,体现了良好的灵活性、可重用性和易扩充性;同时,因为该工具起源于一个证券业数据仓库项目,所以有着很强的面向证券业务的行业特性。目前,本文已经把该工具应用到了SD&C信息统计分析系统中,通过该系统在中国证券登记结算公司深圳分公司的实施成功,证明了本ETL工具良好的使用效果。