ETL工作流优化及其性能分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:honeykaka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据仓库已经发展到能支持企业决策,甚至支持企业合作伙伴和客户的新高度。新一代的数据仓库应用不仅改善了企业战略的形成,更重要地是发展了战略的执行决策能力。ETL(抽取、转换、装载)是数据仓库系统开发中的重要组成部分之一,ETL过程的正确与否关系到数据仓库的可用性。本文主要对ETL工作流进行了优化研究,并采用紧同步随机Petri网对优化前后的ETL工作流进行了性能分析研究。本文首先介绍了一个ETL活动模型,分析了影响ETL活动执行时间的因素。ETL工作流的优化问题可借鉴状态空间搜索问题来解决:把一个ETL工作流看作一个状态图,对每个状态图采用状态变换产生的所有可能的等价状态图,从中找出代价最小的状态图即为最优ETL执行过程。然后引入状态空间搜索算法,通过对启发式算法和贪婪算法的优化,实现了对ETL工作流的优化。通过一系列的实验结果证明,优化的结果减少了ETL工作流的执行时间,也为ETL过程实施的控制提供了很好的参考数据。最后用紧同步随机Petri网对ETL工作流模型进行描述,在前面实验的基础上对ETL工作流进行了性能分析,也从这一方面再次证明了ETL工作流优化的有效性。
其他文献
互联网的发展加速了信息传递,不仅为教学提供了丰富教学资源,互联网在线学习模式也逐渐发展起来。不同于传统学习模式,互联网在线学习模式能够为用户提供不受时间,空间约束等
在我国,工业炉窑在基础产业与传统产业均占有重要地位。但是普遍存在着高能耗与高污染的重要问题,也是迫切需要解决的重要技术难题。有部分企业和相关科研单位已经进行了大量
伴随着现代测控领域的发展以及后PC时代的到来,嵌入式系统的应用越来越广泛,寻求其新型化、智能化正在成为研究的焦点。嵌入式软件开发环境的研究是嵌入式系统领域的一重要分支
无线传感网络是由大量微传感节点间的相互协作来完成某一特定任务的自组织网络。作为一种新兴技术,无线传感网络有着广泛的应用前景,而定位跟踪正是无线传感网络的重要应用之
随着Internet和Intranet技术的广泛应用,数据存储不仅在容量上爆炸性增长而且对网络存储的要求也越来越高。传统的网络存储已经不能满足企业对存储系统高可靠性,可扩展性和安
伴随着知识经济的兴起,一种新的管理模式---知识管理开始出现并引起了人们的重视。知识管理的目标是创新,知识共享和重用是创新的重要前提和保障,产品概念设计领域作为设计新知
网络业务需求的快速增长对互联网服务质量(QoS)提出更高的要求,而业务交换节点成为制约网络性能的主要“瓶颈”之一。由于互联网络复杂的动态特性可以通过网络所负载的流量来
近年来,互联网技术和信息技术的飞速发展使得通过网络进行通信的网络社交成为可能。在众多的社会网络平台中,微博成为了使用广泛、最受人们欢迎和研究学者关注的社交平台,微
随着网络规模的迅猛发展和新业务的大量涌现,如何提高网络的服务质量成为当前迫切需要解决的问题之一。新一代网络技术MPLS(Multi Protocol Label Switching)在继承了ATM标签
CTI(ComputerTelecommunicationIntegration:计算机电话集成)计算机技术广泛应用于通讯领域后逐渐发展起来的一门综合技术。这种电信与计算机技术的融合为电信业带来了广阔的