数据仓库数据源质量保证的方法和步骤

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jamesshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据仓库在各行各业的广泛应用,数据仓库的数据质量逐渐成为决定数据仓库建设成败的关键因素之一,而提高数据仓库数据源的质量正是提高数据仓库数据质量的第一步.该文的重点是研究在数据仓库数据采集模块进行数据质量检测内容和检测的步骤.论文的具体内容如下.在介绍了论文的背景及研究的项目后,该文首先分析了脏数据对数据仓库的影响,并阐述了脏数据产生的原因和数据仓库数据质量的有关理论.接着结合作者参加建设的中国联通统一经营信息服务系统,研究了高质量的数据仓库的设计原则和检测数据仓库数据质量的方法.在以上研究和理论的基础上,作者结合参加数据仓库项目的经验,首先对数据仓库数据源的错误类型和针对每一类错误相应的检测办法进行了详细地阐述,接下来分析了如何将数据质量的检测融入参加建设的中国联通统一经营信息服务系统的数据采集模块,最终得到融入相应的检测内容后数据采集模块的体系结构.最后,作者总结了该文的局限性并提出了有关下一步工作的几点建议.
其他文献
随着科学技术的不断发展,人们对产品的质量要求不断提高,同时,随着人们生活水平的提高,各式各样的卡片(如:银行卡、购物卡、会员卡等)的需求量也随着增加。然而,由于车间环境、机器
随着互联网络稳定性的增加,IP电话技术的不断成熟,以及IP智能网服务的增加,IP电话正在被越来越多的人所喜爱,其网络规模越来越大.在国内IP电话网中,主要采用H.323协议体系.迎
网络管理系统是通信网络的重要组成部分,是保证通信网正常、经济、可靠、安全运行的重要支撑手段.网络管理系统应用软件是网管系统中直接向人们体现网管系统功能的部分,随着
逻辑模拟是电子设计自动化(Electronic Design Automation-EDA)的重要组成部分,通过软件模拟来验证设计是否在功能和性能上达到预期的要求.随着集成电路复杂性的日益提高,传
"PCS网管通信适配系统"是中兴通讯成都研究所自主开发的小灵通PCS集中网管系统中的一个子系统.随着电信业的快速发展,我国电信网的网络规模越来越大,网络结构越来越复杂.在这
随着移动互联网和物联网的快速发展,全球数据量出现了爆炸式的增长,传统的数据存储和计算模型难以适应这种海量的、复杂的、高速的和低价值密度的大规模数据,为了解决海量数据的
随着多媒体技术的发展和网络的日益普及,数字作品的网络发行已成为新时代文明传播的重要方式。但数字数据本身特有的易复制、易修改、存储费用低、传播迅速等特点使得数字作品
近年来,移动通信飞速发展,数据业务层出不穷,对网络和业务的有效管理日显重要.电信管理论坛对网络管理体系和业务管理方法进行了大量研究,提出的电信运营图(TOM)被网络运营商
电信技术的发展使得网络传送信息的方式不断进步,PDH的缺陷和SDH的优势使得后者在中国的传送网中获得了勃勃生机.网络的正常运行离不开完善的管理.因此,人们对网络管理系统的
在自然语言处理(NLP)中,词义排歧(Word Sense Disambiguation)一直是研究的重点和难点,对其他的语言信息处理任务具有重要的理论和实践意义。词义排歧任务是一项“中间任务”,其