ETL过程的思考

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:cicihaicic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ETL是构建数据仓库的一个非常重要的环节,可以这样认为:ETL就是整个数据仓库系统乃至整个决策支持系统的基石。如何设计高效的ETL过程就成为了众多计划或正在实施数据仓库项目的企业考虑的重要问题。从前期的数据理解阶段人手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案。提出了以数据理解为根基,以清洗转换为中心的设计思想,并给出了具体的实施步骤。
其他文献
随着办公自动化系统应用的日益深入,产生了大量的历史数据,同时,在办公自动化系统中,也需要利用历史数据和环境数据进行办公自动化的辅助决策。因此可以利用Web数据仓库技术,将办
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表
用户在访问Web站点时会碰到很多问题,主要原因是Web站点对用户需求缺乏适应性。为了提高Web用户的服务质量和用户的满意度,在用户访问网站点击流形成频繁序列模式的基础上,提出
AVS是《信息技术先进音视频编码》系列标准的简称,是中国自主制定的音视频编码标准,主要面向高清晰度电视、高密度光存储和移动媒体等应用。它是一套包含系统、视频、音频、媒
随着协同虚拟环境概念的提出,使得多用户之间基于特征的建模设计成为可能并迫切需要一个有效、灵活并支持异地分布的多用户协同工作的系统。在文献[2]提出的特征重排思想的基
EML格式是各类电子邮件软件中所支持的一种通用格式,遵循RFC822及其后续扩展。文中对EML格式做了细致的分析,在此基础上.使用VC作为开发工具,实现了Windows平台下对EML文件中各类
结合笔者开发大型国资管理系统的实践,首先介绍Strurs框架的体系结构以及基本设计思想,重点分析了该国资管理系统的整体设计架构,并给出利用Struts框架构建该Web应用的详细设计
传统的图像修复算法对纯结构或纯纹理图像有较好的修复效果。对于一幅既有结构又有大量纹理的图像,可先将图像分解为结构子图和纹理子图,再分别用不同的方法处理两子图,最后把处
本体是概念、属性和关系的集合.本体映射是解决本体异构的最好方法。文中针对目前本体映射过程中概念相似度计算存在的问题,提出一种综合的相似度计算方法。先根据本体中两个概
图像编码国际标准凝结了过去几十年这一领域的研究成果,对多媒体技术的发展起到了巨大的推动作用。介绍了静态和运动图像压缩编码国际标准的发展过程中出现的一系列标准,特别