SD&C信息统计分析系统ETL工具的研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:a5b4123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文首先简要介绍了ETL工具的基本概念和ETL工具的三个核心问题:数据的抽取、数据的转换和数据的装载,然后深入细致地分析了国内外流行的ETL工具的功能特色,并讨论了目前数据仓库系统中ETL工具的应用问题。最后,本文采用Java语言、AS/400系统上特有的RPG语言和SQL语言以及移动Agent技术开发了一个应用于数据仓库系统的ETL工具。本文重点讨论了该工具的设计和实现。   本ETL工具采用了ETL过程定义和过程执行分开的体系结构,支持用户自定义数据的处理方式,支持用户任意的扩展工具的功能,体现了良好的灵活性、可重用性和易扩充性;同时,因为该工具起源于一个证券业数据仓库项目,所以有着很强的面向证券业务的行业特性。目前,本文已经把该工具应用到了SD&C信息统计分析系统中,通过该系统在中国证券登记结算公司深圳分公司的实施成功,证明了本ETL工具良好的使用效果。
其他文献
经典逻辑中的SAT问题是指布尔表达式的可满足性问题,它是计算机科学中的核心问题。SAT问题是NP完全问题,从理论上说,SAT问题不能在多项式时间内解决,它超出了现代计算机的能力。
随着科技的进步,电视正在由传统的模拟信号电视向数字电视过渡。数字电视相对于模拟信号电视不仅画面更清晰而且提供了更多的功能。数字电视设备的开发和调试与模拟电视设备
  资源约束规划问题是智能规划研究的热点。由于引入资源约束条件,使得求解这类问题在搜索过程中需要消除的冲突数大大增加,从而增大了求解难度。而消除冲突的过程占用绝大部
网络信息传输主要有以下两种传送方式:文本传送和语音传送。通过email,oicq等即时通讯软件传送的信息由于其信息格式比较固定,现阶段已经具有较好的研究方法;而语音方面比如网
该文针对分布式入侵检测与响应协作模型、报警关联与分析算法、网络入侵检测方法和数据库系统的入侵检测四个重要问题,结合XML技术、数据挖掘和计算机免疫学技术进行了研究.
目前大多数信息检索都是使用基于关键字匹配的检索方式,该检索方式的核心是关键字符的机械匹配,忽略了文档之间语义层次上的关联,从而导致了检索准确度的下降。为解决现有文本检
纺织品面料的图案制作方法包括绣花、灯芯绒等非平面织物织造而成以及丝网印花、手绘、数码印花等印染而成。其中,非平面织物图案具有有层次,立体感强的优点,但是,其产生图案
红外成像具有被动工作、抗干扰性强、全天候工作等优点,在民用和军用领域得到广泛应用。由于红外成像特有的成像机理,导致生成图像模糊、对比度低,使得红外图像不利于后续如目标
  本文围绕着对等资源共享,重点研究了结构化P2P网络数据存储和检索的机制;分析了两种解决结构化P2P网络负载平衡问题的方案,并提出了一种新的解决思想;讨论了各种穿越NAT的方
  本文旨在研究软件模型检测及其工具实现,包括模型的表示、检测的算法、实现方案、案例分析和如何与软件开发过程相结合等问题。本文从模型检测、软件模型检测的基本理论讲