基于ETL的数据集成过程模型

被引量 : 0次 | 上传用户:wangtianxin1818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球化的发展,各行各业都将业务拓展到全球,全球信息化成为未来的发展趋势。为了满足当地的各项政策法律以及新市场的要求等,需要有新的信息系统提供支持。这就形成了各个信息系统之间的交互鸿沟,即所谓的“信息孤岛”。针对“信息孤岛”,有很多种方式让信息系统之间能够交互,与之相比,数据集成则是更棘手的问题。由于各信息系统是异构的分布式数据源系统,因此数据集成需要将分布在各地异构数据源的各种类型数据如类似于文本文件的非结构化数据,XML等半结构化数据,以及数据库的结构化数据等转换成统一的数据视图,供下游系统统一使用。目前这种数据集成需求随着业务全球化的发展而不断加强。然而,当今数据集成仍面临若干关键问题需要解决:1)如何从异构的分布式信息系统中读取数据,并且高效地将异构数据转换为统一的数据视图;2)如何进行数据清洗完成数据在业务层上的转换;3)如何拓展数据集成的驱动模式提高实时性。针对这种分布式异构数据源的集成需求,本文提出了一个基于ETL(Extract-Transform-Load)即数据抽取、转换和加载的集成过程模型。本过程模型采用数据提供者读取数据,通过元数据映射方式完成异构数据向统一数据视图的转换;针对转换之后的数据,通过简单规则引擎执行对客户系统定制的业务规则来完成数据在业务层面上的转换。同时将传统的数据集成的驱动模式——任务调度,拓展为同时支持任务调度和按需实时性事件的双驱动模式。本文在解决上述问题的过程中同时考虑了数据集成的性能,本过程模型通过增量式的数据集成和在数据库端运行的基于存储过程的规则引擎减少了数据传输的网络开销,提高了数据集成的性能。
其他文献
弱势群体是发达国家和发展中国家都存在的一种普遍的社会现象。随着我国市场经济的发展和社会结构的急剧转型,弱势群体问题凸显,成为影响社会稳定与发展的重要风险因素,并成
<正>与其他品类的电商相比,酒水电商已经低迷了太久。在三公政策的影响下,酒企面对着销售低迷的困局艰难度日,终于给酒水电商带来了迅速发展的一个时机。除了这个直接原因,更
期刊
目的初步探讨HER2高表达胃癌细胞的淋巴结转移特点。方法选取接受胃癌手术的患者62例,记录患者的性别、年龄、肿瘤分期、手术淋巴结清扫范围等,以及术后淋巴转移的数量和部位
分析性能评价是对候选试验进行系统评价,测定其误差。用于常规的试验必须保证其误差在临床可接受范围内。根据美国临床实验室修正法规1988(CLIA’88),分别说明分析性能评价的
蜂蜜、甜型葡萄酒和桔子原汁中主要糖类包括葡萄糖、果糖和蔗糖,测定糖类的传统方法有多种,如:测总含糖量的方法有盐酸—酚法、蒽酮比色法等,测还原糖含量方法有直接法、间接
坚持可持续发展战略,发展首都文化孟固坚持可持续发展战略,走可持续发展道路已成为全人类的共识。在实施可持续发展战略的过程中,文化的地位和作用日见突出。1986年12月联合国大会通过
酿酒酵母菌是影响葡萄酒质量和感观风格的重要因素之一。在传统的葡萄产区,酿酒酵母逐渐适应了当地的气候、土壤和葡萄品种,再加上自然选择的作用,形成了适应当地葡萄的酿酒
对关爱教育理念内涵、本质和实践的考察显示,提高高校人才培养工作质量要秉承以学生为本、立德树人的关爱教育理念,结合高校的实际,落实"三全育人"、坚持德育为先、构建关爱
自20世纪80年代中期以来,一种被统称为“农村合作经济组织”的制度形式在中国广袤的农村大地上悄然兴起,并迅速发展起来。这种制度安排既蕴涵着中国农村社会中制度需求的极为
通过禄丰城区的多个工程项目勘察 ,对本区“硬壳层”的工程地质条件进行分析 ,论证其在 6 7层民用建筑工程中作浅基础的可行性。