数据仓库ETL过程支撑框架研究

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:lovelyhuanhuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先系统分析了当前数据仓库建设过程中数据迁移遇到的困难,在此基础上,提出了一种解决专用数据抽取、转换、加载(ETL)工具和实现程序集成的支撑框架。应用该ETL支撑框架,可以极大地方便用户对ETL工具的使用和管理,并有利于数据加载故障恢复的实现,提高效率。
其他文献
建立有效的现代科技成果转化机制对义乌小商品发展具有深远的现实意义。发展科技中介是提高科技成果转化率的途径之一。科技中介在义乌小商品转型升级中的功能主要体现在:搭
本文对基于模式的时间序列的相似性进行了研究,提出了基于模式的全序列相似性查询方法.本文定义了DTW路径上的平均距离作为序列的相似性距离,基于模式的数据抽样方法和抽样过滤
目的了解昆明地区肠黏附性大肠埃希菌(Enteroaggregative Escherichia coli,EAEC)的流行特征,为防治EAEC感染提供科学参考。方法收集云南省昆明市4家哨点医院的腹泻患者粪便
本文给出了时态关联规则挖掘的问题描述,并将问题分成三步:分区、挖掘、表示。在包含时间戳域的事务数据库上分别阐述了每个步骤的解决方法.在以后的工作中,将继续研究如何扩展
在大多数实际问题中,机器学习的成败很大程度上取决于学习方法的噪音处理能力。本文介绍了基于可变精度粗集的规则简化方法。实验结果表明,采用GMM规则简化方法对决策树规则进
本文提出改进的语言值关联规则挖掘算法。改进的算法在发现大语言值属性集时采用类似布尔型属性快速算法中发现大属性集的方法,能处理属性数量较多的情况,克服了组合方式发现规
关系规则是数据发掘中非常重要的研究领域,为了从数据库中挖掘出更多更有效、更有价值的规则,本文对关联规则的结果进行了模糊化。
本文研究了一种应用粗集理论的数据方法,给出了挖掘模型和算法,最后,通过一个实例证明了该方法的有效性和实用性。
近年来,从大量的历史数据中发现和提取有价值的知识成为人工智能的一个新的领域,其研究主要集中在分类、聚类和关联等方面,近年来有关时态约束的KDD研究成为热点之一,国内外
挖掘关系规则是数据挖掘中的热点问题。本文研究了基于交互式模式分解的关联规则发现算法,它根据频繁集和非频繁集的个数,对事务项集进行分解,从而求得全部频繁集,其优点在于:(1