摘要:随着油田水平的不断提高,数据在“数字油田”建设中的价值与意义逐渐凸显。本文阐述了数据仓库的定义,分析了油田数据仓库的特点,并从数据仓库建设范围、数据仓库功能设计两方面探讨了油田数据仓库建设。重点从源数据层建设、数据整合层建设、数据仓库管理层建设和数据应用层建设,以及数据库安全建设、数据库共享机制建设六个方面,详细进行了数据库建设研究,以期促进油田大数据的深入发展。
关键词:油田;数据仓库;信息化;应用
数字油田的基本概念和发展方向就是将涉及油气经营的各种资产,通过数据采集、数据解释与模拟、提出并评价各种选项、执行等。石油企业是一个多学科、多专业相互配合、相互渗透、协同攻关的知识、技术密集型企业,通过数字油藏、动态性、实时性、虚拟化油田和协同工作环境等方面展望,油田数据库的应用前景广阔。构建一个以数据仓库系统为核心的综合数据资源中心、并提供统一的数据服务能极大提升油田应用的信息化水平,因此,完善油田数据资源中心的建设至关重要。
1数据仓库库概述
1.1数据仓库定义
数据仓库是面向主题的、集成的、稳定的和随时间变化的数据集合。它以传统数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法,以人工智能作为挖掘知识和发现规律的科学途径,通过对原有数据进行抽取、转换、加载形成真实、全面、统一的数据。因此,构建一个以数据仓库系统为核心的综合数据中心平台能大大提高油田应用信息化水平。
1.2油田数据仓库特点
油田数据仓库系统需具备统一性、敏捷性、实时性和协同性等基本理念。因此,油田数据库系统应具有以下特性。
(1)油田数据仓库具有统一的规则(如标准、接ISI等),这是建设油田软件系统平台的基础,在此基础上方可支撑敏捷性、可扩展性等其他基本要求。
(2)油田数据资源中心还应具备良好的敏捷性和可扩展性,以快速企业经营环境的变化做出反应,并适应企业新的应用开发与部署。
(3)油田数据资源中心将油气整个勘探与开发过程设计为实时处理,并满足不同专业的工程师均能动态、快速地获取及共享数据信息,并及时掌握和控制油田全部生产过程和经济活动。
(4)油田数据库系统需具有协同性,其所创建的资源共享环境,应满足企业管理专家和专业技术专家方便灵活的协同工作。
2油田数据仓库建设与应用
2.1油田数据仓库建设范围
构建油田数据中心涉及海量数据信息,既包括历史数据,又包括油田生产实时监测数据。数据仓库的建设应该支持油田生产经营的各个方面,包括地质勘探、油藏分析、油气运输、经营管理等。采用分层结构“自底向上”构建数据中心平台,系统数据流程为从源系统抽取数据,进行数据转换后加载数据仓库中,然后由多维分析工具多层次分类成有效信息,与数据挖掘工具有机结合,最后通过可视化工具将分析结果呈现给用户。
2.2数据仓库功能设计
结合油田生产实际情况,整个数据仓库的总体架构共分为源数据层、数据整合层、数据仓库管理层以及数据应用层4部分。
2.2.1源数据层建设
源数据层主要是油田各业务系统数据库;油田业务涉及到多方面的数据源,如勘探数据、地质数据、油气运输数据等。此外还要考虑很多外部数据源,如物料价格等。所有这些数据存储在不同区域、不同部门的异构数据库中。源数据层收集、统计这些异构数据库,并明确各个数据库数据的具体用途,进行数据来源信息的登记管理。
2.2.2数据整合层建设
数据整合层进行数据的抽取、净化、转换等操作,并将处理后的数据加载到数据仓库;数据处理是一个存储区,装载维度表和事实表,为输出到数据集市做好准备。由于各个数据源采用的组织形式和操作系统平台的不同,可能造成数据不一致的问题,因此在构建数据仓库时必须用数据迁移工具通过专门的数据接口对数据源进行提取、转换、清洁,然后按照一定规则集中到数据仓库中,从而保证数据的一致性。
2.2.3数据仓库管理层建设
数据仓库管理层负责数据仓库和数据集市的管理与维护。数据仓库实现对预测主题和信息的存储与综合;预测执行完成后的结果存储在数据仓库中,形成决策信息库。如探井随钻分析,就可以把随钻分析的决策点信息存入到数据仓库中,和其它已存入数据仓库的地质数据信息进行综合分析,得出最优的钻井设计方案,提高生产措施的有效率。引入数据集市是因为通过将数据仓库和数据集市分离的方法,可以使数据仓库集中精力解决数据整合和清理等问题,而数据集市则致力于为特定的决策过程提供服务。数据仓库在数据源和直接面对决策支持过程的数据集市之间形成了一个缓冲,数据集市可以面向一个优良的数据仓库来建设,数据源的变化可以不直接影响到数据集市。
2.2.4数据应用层建设
数据应用层通过数据挖掘工具和联机分析处理工具,完成用户的决策处理任务;并通过问题的分析与综合、查询分析、管理维护等方式实现用户与系统的动态交互。建设数据仓库的最终目的,是让油田业务系统的管理人员能够方便地使用数据仓库这一集成的决策支持环境以获取有价值的信息,从而能对油田实际生产提供对策支持。因此,数据应用层要求提供界面友好、功能强大的交互界面。考虑到油田先進的局域网络,基于数据中心采取B/S方式,通过Web服务器为各客户端提供服务。
2.3数据仓库安全建设
数据仓库的管理者需要解决法律与政策、行政监管、合理组织以及攻克技术挑战,在隐私权保护、信息安全以及数据流动之间在定制功能时进行利益权衡。持续深化数据库云计算平台建设与应用,不断加强信息技术的应用建设,建设集中统一的数据中心和信息技术网络资源,在此基础上构建数据库的安全治理体系建设,实现大数据的有效聚合,保障数据安全,为智能油田大数据分析和业务共享服务提供有力支持。
2.4数据仓库共享机制建设
数据库共享数据应当应用一致的标准框架。制定油田大数据的共同标准,这是收集、链接、共享和分析不同数据集合的关键元素。智能油田大数据仍需要大量的技术研发来制定严格的数据使用标准。但是,目前人们对于智能油田大数据的标准现状和未来需求,仍缺乏明确清晰的认识。在数字油田中,大数据的分析员经常需要花费一半以上的清理数据,因为有大量的数据是以非机读或非标准化格式来提供或者收集的,需要进行人工的手动处理。因此,必须制定统一的数据标准,提高数据库共享机能,避免浪费不必要的人力物力。
3结束语
数据仓库帮助油田实现设备长周期管理,同时在财务预算、物资采购、工程建设等方面提供了重要的数据支持。智能油田高度依赖深度的数据挖掘和应用,所以开发和提供开放的数据结构和平台至关重要。综合数据仓库建立后,必须推动各相关部门之间的资源共享,为油田生产运行提供技术支持。
参考文献:
[1]谷岩,冯华.数据仓库系统中组件的实现技术研究[J].计算机工程与设计,2005(7).
[2]姜震,黄霞.实时数据仓库技术的研究[J].计算机系统应用,2007(7).