基于DataStage的自动转换及测试工具的设计与实现

被引量 : 0次 | 上传用户:hujieguang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据仓库的广泛使用,如何向数据仓库获取或者加载来自于不同硬件平台,不同操作系统,不同数据模型的多种业务数据,已成为数据仓库建立的关键问题。目前,系统的数据来源复杂而且分析应用尚未成型,IBM的数据抽取、转换和装载工具DataStage得到了广泛应用。DataStage包括多种类型的Job,Job定义了一系列如何执行数据抽取、转换和装载的步骤,常用的Job分为Server Job和Parallel Job。其中,Parallel Job支持并行处理体系结构,与Server Job相比,其具有更高的性能优势。为了获得更高的性能并缩短开发时间,采用Server Job的用户倾向于进行版本的迁移及升级。目前,市场上并无实现Job自动转换与测试的相关工具,设计和实现的技术、理论都是由IBM提供和支持。本系统使用Java/J2SE进行开发,包括自动转换和自动测试两个大功能模块。自动转换模块包括导出模块、树结构创建模块、转换模块、清洗模块和导入模块,用于实现Server Job向Parallel Job的自动转换。导出模块封装DataStage底层命令,使Job以XML形式导出。树结构创建模块使用DOM解析XML并构建树结构。转换模块通过替换相应的Parallel Job元素来重构XML结构树,从而获得了对应的Parallel Job。清洗模块重命名Job元素,防止破坏原始Job元素。导入模块封装DataStage底层命令,将XML形式的Job导入到DataStage服务器。自动测试模块包括导出模块、树结构创建模块、测试数据生成模块,校验及显示模块,用于验证和校验自动转换生成的Job。树结构创建模块使用DOM解析XML形式的Job来获取数据源模式。测试数据生成模块使用获取的模式,创建用于生成测试数据的Job并通过运行Job来获得测试数据。校验及显示模块将生成的测试数据作为数据源并比较、显示两个不同类型Job的运行结果。与手工转换相比,自动转换在开发效率上提高了70%,在成本上减少了50%,带来的直接和间接利润高达60%。
其他文献
随着机械电子与生物医学工程的发展,医疗器械向更科技化、微型化、人性化的方向发展。以色列Given Image公司于2000年首先开发无线胶囊内窥镜成功,并应用于临床,克服了传统的缆
随环境、时间的变化,品牌的定位也要不断发展,不可能一劳永逸,在企业成长过程中,当企业面对的市场环境和社会文化、社会背景以及消费者的偏好发生变化,原来的品牌定位也可能变得不
随着微电子技术、电力电子技术和工业以太网技术的快速发展,传统运动控制系统的控制模式、快速性、稳定性和开放性等已经不能满足现代制造业的发展需求。基于实时工业以太网的
大学生的价值观是大学生在实践过程中不断形成的对客体价值的认识、态度和观点,它支配和影响着大学生在实践中的决策过程和行为选择。20世纪80年代以来,中国社会转型引起人们
本文对工业炸药中硝酸铵热分解特征的相关研究进行了回顾。通过对影响硝酸铵热稳定性因素的分析和总结,探讨了改善硝酸铵热稳定性的各种途径,为工业炸药的生产和应用提供参考
新时代,科学技术因人类智慧而迅速发展,数字技术在传媒领域逐步得到广泛应用,为了进一步满足受众的期待,新媒体也在不断探索着适合自己风格的发展方向。融媒体大数据时代的到
采用有限元计算方法研究了在4点弯曲载荷作用下,残余应力、涂层与基体的弹性模量比(简称弹性模量比)对涂层/基体材料界面能量释放率及其相角的影响。结果表明:能量释放率随着
<正>健康教育作为整体护理的重要组成部分,是现代医院为满足患者健康需求而赋予护士的重要职责[1]。随着医学模式的转变,健康教育不再局限于患者,而是通过有计划、有组织和系
重点研究了氮气氛烧结方法制造的 CuW/Cu高压开关触头材料的结合强度,并比较了不同制造方法对 CuW/Cu触头材料结合强度的影响.材料抗拉强度试验结果显示,氮气氛烧结方法制造
杉杉集团的多元化之路困难重重,正是中国企业跟风式多元化发展困局的缩影。