基于元数据的数据质量控制与评估模型研究

被引量 : 0次 | 上传用户:luobo330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据是企业的资产,而数据的质量高低决定着这些资产的价值。由于数据质量问题是普遍存在的,同时也是不可避免问题。因此,如何为企业的决策提供高质量的数据已经成为制约企业信息化发展的关键问题。针对油田数据数量多、种类庞杂、横跨专业多等特点而引起的数据质量不高的现状,本文以数据中心数据为研究对象,通过分析产生数据质量问题的原因,以元数据、数据质量、数据建模等理论为基础,并对数据流动过程中的质量检查、质量控制和质量评估等进行深入的研究,提出了基于元数据的数据数据质量控制与评估体系模型。该模型体现了全程数据质量控制的思想,即将影响数据质量的因素分散到几个重要的阶段,包括数据字典元数据的质量、模式层、实例层中约束规则数据库的质量以及数据质量评估标准的质量。如果能够对上述几个阶段进行质量控制,那么企业数据的质量将会得到强有力的保证。本文针对数据中心的应用数据构建了数据字典,从数据建模的源头就开始对元数据进行控制;并根据现有数据的质量状况,从数据的完整性、一致性、准确性及时效性四个方面构建了数据质量定义模型;同时,基于数据质量定义模型在数据的模式层与实例层定义了相应的约束规则元数据模型库;然后,基于元数据模型库对数据的质量进行了控制与评估。针对数据质量可能出现问题的每一个环节,采用不同功能的元数据对数据质量全程控制,从而全面提高了数据质量。最后,本文给出了基于元数据的数据质量控制与评估系统的实现,并将其初步应用到数据中心项目中,验证结果表明:基于元数据的数据质量控制系统具有良好的运行效率和运行效果。
其他文献
本文立足于综合评价技术,以参与科研开发的项目组成员的整体团队能力为研究对象,在分析总结国内外科研项目团队能力评价现状问题的基础上,对科研开发项目的主要管理技术和评
数据中心就是为油田生产和开发服务的信息管理平台,把原本分散在各采油厂的信息孤岛连接在一起,为油田生产发挥更大的信息服务。保证数据中心的信息安全,是建设数据中心的研
在市场经济中,企业管理的重心已由生产管理转向经营管理,成本管理则是经营管理的核心内容。近年来,中国石油企业对其成本管理模式研究及应用予以了高度重视,并取得了显著的成
通过对偏心环空流场中流体的流动问题进行的大量调研,和对赫—巴流体流变模式的了解;文章中介绍了非牛顿流体的分类以及赫—巴流体的定义,还阐述了偏心环空流场的研究状况及
职业教育的发展离不开高素质的职业师资队伍,教师培训是教师专业成长的有效途径,是师资队伍建设的重要环节,因此,对职业教育师资培训的现状进行研究进而发现其存在的问题和不
随着社会主义市场经济体制的逐步建立、发展,以及中国高等教育改革的进一步深化,高校的毕业生就业制度也发生了深刻的变化。在毕业生的就业活动中,社会用人单位和人才市场的
大学生是社会主义事业的接班人,是知识分子的一部分,其有序的政治参与对于我国民主政治的进程至关重要。任何行为的做出都是受其心理的支配的,是其心理的外在表现形式。政治
生物柴油是当今能源开发利用的一个发展趋势,生物柴油产业的兴起使得甘油大量过剩,因此甘油的再利用成为科学界的一个研究热点,其中甘油催化氢解制备丙二醇受到了普遍关注,不
系统集成项目的工程质量受人员、材料、机械、方法和环境等因素的影响。确保系统集成项目的工程质量要从做好勘察设计阶段质量管理,明确工程质量事故处理的基本要求和处罚标准
如何构建合理高效的会计管理体系,是管理者们一直在思考的问题。经过多年的实践,垂直管理部门例如工商、质监等认为:因为人、财、物全部上划,比较适合集中核算的会计管理体系