基于CDQ的油田开发数据质量研究

来源 :东北石油大学 | 被引量 : 0次 | 上传用户:yoyo220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的发展,数据呈现爆炸式增长,数据质量问题也越来越突出。为了保证数据能够提供有效信息,数据质量的保障工作成为了企业的重要任务之一。面对各种各样的数据质量问题,大多数企业都结合业务需求开发了专有的数据质量管理系统,但是这些系统大多数没有给出数据质量维度以及约束规则的规范化表示,因此迫切需要解决数据质量的规范化、标准化问题,油田企业也不例外。同时,如何描述定义在实例层上的约束规则以及模式层上复杂的约束规则也是目前研究的热点之一。除此之外,由于国际上倡导开放数据的理念,与其他数据关联以获取比较权威的数据、结构或者其他必要描述,也将有效的提高数据质量。为了解决上述问题,首先,本文对国内外数据质量维度、约束规则、数据质量管理框架的发展历程以及数据质量评估技术进行研究,为以后的研究提供理论支撑。其次,研究关联数据技术为解决数据关联问题提供依据;再次,针对目前数据质量评估模型存在的不足,结合上述研究的先进技术和实际需求,参照斯坦福大学提出的七步法,提出一种新的构建数据质量管理元本体的方法,构建了与领域无关的通用数据质量管理元本体。在构建元本体的过程中,引入CDQ(Comprehensive methodology for Data Quality management)框架,为构建元本体提供整体理论架构;在语义层面,引入本体技术以对数据质量有关概念进行规范化,并对复杂和实例层的数据质量约束规则的描述问题进行解决;为了解决数据之间的关联性问题,引入关联数据技术,利用URI标识资源。然后,在已构建的数据质量管理元本体的基础上,提出了基于SWRL规则的数据质量管理推理,实现对数据质量隐含知识的推理。最后,以油田开发为背景,进行了数据质量管理系统的设计与实现。该系统实现了数据质量管理元本体的解析和维护、约束规则和清洗规则的维护、基于SWRL规则推理,并在推理的基础上进行质量评估和数据清洗,验证了所提出的基于CDQ油田开发数据质量研究的有效性和技术可行性。
其他文献
针对模式分类算法不直观的问题,提出一种基于径向坐标可视化分析高维数据的方法。由最大似然原理估计高维数据的本征维数,用较少的变量结合径向坐标可视化方法对高维数据进行可视化降维分析。在径向坐标中揭示高维数据集中类别和特征间的关系,寻找基于不同特征排列顺序的最优映射,并结合多种机器学习方法对数据集进行分类。应用于UCI数据库中的6个数据集的结果表明,该方法具有较好的可视化和分类效果。
目的:研究委陵菜积雪草酸(asiatic acid from potentilla chinensis,AAPC)对非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)肝细胞脂质沉积、氧化应激、炎症反应、脂肪生成相关蛋白以及内质网应激(Endoplasmic reticulum stress,ERS)相关信号通路基因及蛋白的表达情况,探讨AAPC对NAF
素质教育是弘扬学生主体性的教育。是关注学生个性化发展的教育。素质教育是在体育教学中推行主体性教育的指导思想。以素质教育为中心的教学改革,使体育教育者教学思想发生了
随着互联网向移动互联网转化步伐的不断加快,近年来,共享经济模式迅速渗透到社会生活的各个方面,O2O这种当下最火的线上线下相结合的新型商业模式给人们的生活带来了极大的快捷与便利。自2014年起,在创业热潮与市场资本运作的不断推动下,网约车服务平台在国内如雨后春笋般迅速发展,这在一定程度上缓解了诸如交通拥堵、环境污染、能源紧缺等现代城市所面临的诸多现实问题的日益恶化,便捷了人类的日常出行,但网约车服务
研究互联网中的人名消歧问题。抽取与网页文本中人名关键字实体相关的依存特征及命名实体等辅助特征,利用二层聚类算法,根据依存特征将可信度高的文档聚类,使用辅助特征将剩
本文以厦门市不同农业用地垂直剖面土壤为研究对象,共采集1个旱地剖面土壤、2个菜园剖面土壤、2个水稻田剖面土壤和2个茶园剖面土壤(剖面1和剖面2),分别测定了重金属(Cr、Cu
中国南方公路网络随着中国经济的发展而深入山区,公路隧道施工也越来越多,施工环境不断恶化。由于山岭公路隧道设计进、出口处均为山坡,地形起伏大,地表植被茂密。因此,设计
近年来,随着关税壁垒的削弱,非关税贸易壁垒大行其道,成为各国常见的“保护伞”。但诸如卫生与植物卫生措施之类的非关税贸易壁垒由于其隐蔽性等特点,想要刺破其面纱并非易事
针对室外场景深度补全所面临的挑战和困难,使用具有强大的表达特征的能力的深度卷积神经网络作为工具,结合自动驾驶场景下的高精度稀疏深度和其它传感器采集到的大量的数据,
距离因素在国际直接投资的贸易效应中起着重要作用。将样本国数据输入模型。得到的回归结果表明,样本国与中国的经济规模总和、样本国对中国的国际直接投资与双边贸易流量呈正