达梦数据交换平台(DMETL)执行过程改进

被引量 : 0次 | 上传用户:huxiangye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据抽取转换装载(ETL)是数据仓库的核心组成部分,负责从异构的数据源中抽取数据,对这些数据进行清洗、转化,并最终加载到数据仓库当中去。ETL平台开发和设计的好坏直接影响了数据仓库的构建乃至整个商业智能系统的应用。因此,对达梦数据交换平台(DMETL)进行改进以提高产品的指标具有重要意义。在深入研究和分析了达梦数据交换平台的工作原理和机制以及该平台在设计和实现中所涉及的关键技术的基础上,找出了现有达梦数据交换平台存在的不足和缺陷,提出了两种改进方法。其一:考虑到原有DMETL的串行工作方式不利于发挥系统的功效,将流水线技术引入到达梦数据交换平台之中。流水线的工作方式实质上是利用多线程和缓存技术,使得ETL数据的抽取,转换和加载三个环节的执行可以抽象成流水线一样运行在不同的线程实例中,从而减少了中间环节的等待时间。通过流水线工作方式充分的利用了计算机资源,提高了系统的吞吐率,提升了ETL的工作效率。第二,针对原有DMETL增量抽取方式对客户系统进行未授权操作所带来的弊端,同时考虑到实际项目中ORACLE作为数据源的应用较多,设计和实现了针对ORACLE数据源的基于日志分析的增量数据抽取方式。利用ORACLE数据库自身的日志分析工具LOG MINER,对数据库日志文件进行解析,获取用户对数据库的变更操作。通过分析数据库的变更操作来对数据库中的增量数据进行捕获。该方法可以有效降低DMETL对客户系统的影响。通过实验表明,流水线技术的引入是可以在一定程度上提高达梦数据交换平台的工作效率的,并且基于日志分析的增量捕获方式也是可以避免对客户业务系统的侵入。此外,这项工作对达梦数据库开发并提供其数据库日志分析工具也有参考价值。
其他文献
随着我国民主政治进程的发展,领导权力必须是在法律法规范围内运行的"有限权力",在此条件下,领导干部要注重发挥民主作用和意识,大力营造出团队的民主氛围。改革开放三十多年
翻译的技巧很多,注释是其中一种。而脚注作为注释的一种,在翻译研究中鲜有人关注。关于英汉翻译中的脚注问题的研究更是空白。然而,脚注问题的研究对指导翻译实践具有非凡的意义
研究地方政府间竞合关系,不仅能够丰富和发展现代行政管理理论,而且能够有效的推进区域政府间合作,加速经济一体化的进程。本文研究的主要目的是分析京津冀区域发展中政府间关系
目前我国家具产业从地理区位上已经形成了若干特色区域和相应的家具产业集群,中国家具已经进入产业集群时代,家具产业集群不仅推动了中国家具业的整体发展,也为地方经济发展提供
当今高校规模的不断扩大和信息化的发展,学生管理工作信息化将是高校学生工作的必然趋势。通过信息化手段的介入,将提高学生管理工作的效率。
维特根斯坦在《札记》里写道:“洞见或透识隐藏于深处的棘手问题是艰难的,因为如果只是把握这一棘手问题的表层,它就会维持原状,仍然得不到解决。因此,必须把它‘连根拔起’,使它彻
建筑微晶玻璃具有颜色丰富多变、光泽度佳、色差小、强度高、吸水率低等特点,可以替代传统石材应用于高档建筑装饰材料,但由于现有生产工艺中原料价格和工艺成本等因素,使得产品
电信技术的发展和管理体制的变革不断推动电信运维管理体制向集中化、标准化、信息化方向发展。信息安全管理作为电信运维管理的重要组成部分,同样面临着来自技术和管理的两方
用甘氨酸和甲醛在碱性条件下合成了羟甲基甘氨酸钠,经过红外光谱、质谱、核磁共振氢谱、元素分析仪定性分析后,用荧光分光光度法测定,纯度大于99%,并进行了均匀性、初步稳定