电信企业数据仓库数据质量的研究与应用

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:zcb999999999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家电信业改革的深化,国内电信业的市场环境已渐趋合理,竞争将日益加剧,正确的决策无疑是企业制胜的根本。为了支持正确决策,就要求所管理的数据可靠,没有错误,准确地反映企业的实际情况,企业数据质量的管理正在获得越来越多的关注。企业需要提高数据质量,但由于业务系统不断接收到新数据,数据的总量也在不断增加,确保数据质量并不是一次就能够完成的,而是一个长期的工程。因此所有企业都应该使用一种反复进行的阶段性过程来管理数据质量。本文在深入调研电信企业的数据仓库特点和数据仓库数据质量的基础上,对数据质量管理系统进行了分析和设计,提出了要基于工作流技术,建立数据质量的长期跟踪、反馈和改进的数据质量管理方法。   本文通过建立数据质量管理体系,在应用中发现数据质量问题,并将问题反馈给生产系统;通过应用让用户看到效果,调动起用户的热情,并为其树立起信心;通过应用引起领导的重视,保证资源的有效投入;让各级部门关注数据问题,让责任部门有压力也有动力;并针对目前电信企业数据仓库数据质量存在的问题,提出数据质量系统的管理方法,并基于此对数据质量管理系统进行了分析和设计。   本文在详细论述数据仓库的历史与现状、数据质量管理的原理的基础上,提出数据质量的核查规则与改进建议,并以此为理论基础对数据质量管理系统进行分析与设计,将理论研究成果应用于电信企业中的数据质量管理,并给出实验来验证其提出的基于工作流的数据质量管理方法。针对电信企业数据仓库中数据质量检测与评估相关关键技术进行了深入的探索和研究,主要研究内容及成果包括:1)基于数据仓库本身的特点,提出了基于工作流的数据质量管理体系;2)研究分析了当前主要数据质量检查方法及其特点,通过数据质量应用框架综合运用各种数据质量检测方法,实现了对数据仓库数据采集、转换、存储、应用不同阶段的数据质量检测;3)在信息化实践的基础上,针对电信数据仓库中环境异构数据源多、数据量大等特点,分析设计了数据质量管理系统。
其他文献
随着Internet的广泛普及,对等网络很快成为研究和应用的一个热点,其P2P覆盖网的构建得到了极大关注和重视。结构化P2P覆盖网中,资源的分布具有一定的映射规律,但在利用分布式
学位
在互联网高速发展的今天,网络应用早已不局限于传统的网页浏览,电子邮件等,文件共享的地位越来越重要,而传统的C/S模式无法满足用户对于速率的需求,因此P2P逐步成为最重要的文件共
随着多媒体技术的发展和移动设备的普及,人们开始通过手机等设备浏览图像和视频,面向移动设备的视觉媒体应用逐步成为新的消费时尚。与面向电视、电脑等传统展示设备的视觉媒体
近年来,随着Agent技术、理论、应用等方面研究的不断深入,越来越多的工业和商用等应用领域开始采用Agent的方式进行软件系统的构造。其中Agent通信语言(ACL)作为充分发挥Agent
广告的推广、商品的买卖是电商、社交、搜索等诸多类型互联网科技公司主要的经济来源。商品、广告的划分以及用户的点击行为预测,可以帮助企业解决商品、广告的推荐问题。  
RFID(无线射频识别)系统是开放环境下的,没有任何物理或其它可见接触的一种通信技术.由于其布置不受环境影响,成本低廉,所以RFID系统有着广泛的应用前景,目前已在很多领域使用.但
基于FPGA与USB的综合地面检测设备是国家重大科技基础设施项目——东半球空间环境地基综合监测子午链(即子午工程)探空火箭综合监测分系统的组成部分之一。地面检测设备要解
钻井领域的软件开发工作需要软件开发人员和领域专家密切合作来完成,领域专家提供适用于领域内的专业计算算法,软件开发人员依据这些算法实现相应的功能。由于领域专家往往掌握
针对新靶标探索新颖的先导化合物是药物发现和设计过程中最重要的步骤之一。目前,获得先导化合物的途径主要有两种:一是通过基于实验的高通量筛选方法来筛选分子库从而获得有苗
校园网络不断快速发展,己成为反映大学生思想道德健康的一个重要窗口。从校园网络BBS、博客中检测大学生乐于讨论的话题和事件是掌握大学生心理健康的重要途径。为了建立一套