基于ETL技术的电信业数据仓库质量控制模型的研究及应用

被引量 : 0次 | 上传用户:zqtoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库作为支持决策制定过程的重要手段,近几年来得到了迅速地发展,并已经成功地应用到制造业、零售业、金融服务、电信、运输等多个行业,正显示了其勃勃生机和强大的生命力。但是在数据仓库的建设过程中,一个被广泛认识但又常常被忽略的问题是数据仓库中的数据质量的控制。高质量的决策必然依赖于高质量的数据。为了避免得出错误的结论,数据的正确性是至关重要的,否则就会出现所谓的垃圾进,垃圾出(garbage in ,garbage out)的现象。如何检测并排除潜藏在进入数据仓库中数据的错误,以保证数据仓库中数据质量,进而为正确的决策打下坚实的基础,这是在建设数据仓库时必须重点考虑的核心问题,也是本文阐述的重点。本论文提出了基于统一工作流的ETL模型进行数据质量控制的方法,基于这种模型每个数据表的ETL流程都按照ETL的特性统一分为3个标准步骤,即数据抽取/变换(Extract/Convert)、数据转换(Transform)和数据加载(Load—ing),每个步骤需要记录完整的处理中间状态及完善的日志信息。并详细介绍了在ETL各个过程中采取的数据质量的控制方法。然后介绍了这种ETL模型在实际项目中的架构设计及应用。通过对这种ETL模型的扩展应用,设计出了基于ETL技术的数据仓库数据质量的稽核模块。通过该模块的应用可以将数据质量问题分类,建立相应的校验规则及阀值,并支持规则的动态增加。这样就使得数据仓库系统数据质量的控制上升到了一个更高的层次。
其他文献
看似漫不经心的皮革、金属、木头、陶瓷、塑料等材料混搭在一起,将不同风格的元素一同收纳——家居混搭风已经在生活的潮流中日渐风行。
古代哲学在不懈追求世界始基过程中,形成了致思理路的流变:以感性存在物为形而下出发点;经由具体到抽象的流转,形成形而下的揖别与形而上特征的彰显;而重归现实生活问题,乃完
在明确财务可持续增长含义的基础上,分析了财务可持续增长管理在企业管理中的重要性以及企业财务可持续增长的影响因素,利用可持续增长率与实际增长率之间的关系,提出企业财
民间组织广泛存在于社会的各个层面,尤其是在社会价值理念多元化,利益分配转型的过程中,政府会逐步在某些领域改变全能政府的角色,让权于民。这就要求民间组织能够有相应的力
为了解在押服刑人员未决羁押期间的刑讯逼供现状及其主观认知状况,开展了此次调查。调查表明,公安机关侦查案件时,存在着大量的刑讯逼供行为;公诉阶段检察人员较少使用刑讯逼
职业教学的首要任务是培养创新精神,而专业性课程的教育重点在于实践及创新能力的培养。但是对于电子、机电等专业的"电工基础"课程过于抽象,学生在学的时候难免会感到枯燥。
G.DX6S是意大利G.D公司新出产的软盒烟包包装机。其生产速度较高,正常生产速可达600包/分钟,具有较高的生产能力。在使用预切式商标纸时,其商标纸的供料输送及折叠部分的故障
《税务行政复议规则》将税款滞纳金定性为征税行为,并规定税款滞纳金纠纷必须复议前置。这种规定没有法律依据。国家税务总局认为滞纳金没有上限限制,不适用《行政强制法》的
目标企业定价在并购行为中具有至关重要的意义,本文将实物期权方法运用于目标企业的定价,并运用Black-Scholes期权定价模型和二叉树定价模型分析了单一期权和多期权条件下并
中小型企业因资金短缺、人才缺乏、管理不规范等原因信息化应用水平低,难以适应复杂多变的市场经济竞争环境。云计算技术的应用为中小型企业信息化建设提供了新思路。基于云