油田数据信息处理中数据挖掘技术的应用分析

来源 :中国信息化·学术版 | 被引量 : 0次 | 上传用户:liguiming321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】在油田工作中,经常要对大量的数据进行处理。而传统的信息处理方式中常见的问题有信息加工手段差、信息共享程度低、用户分撒、复杂的人工操作等,导致信息的处理不及时,决策部门无法有效的应用这些数据。在油田数据信息处理中引进数据挖掘技术,对数据进行在线分析处理并且提供决策支持系统。
  【关键词】油田数据 信息 数据挖掘技术
  【中图分类号】TP391 【文献标识码】A 【文章编号】1672-5158(2013)04-0217-01
  一、引言
  目前决策科学化、管理扁平化、业务综合化、数据集中化是信息化建设的发展趋势,通过建立数据挖掘系统来处理纷繁复杂、规模庞大的信息数据并且挖掘出隐藏在这些数据背后有价值、有决策意义的信息。
  数据挖掘技术概述:
  数据挖掘就是从大量不完全的而且模糊的、有噪声的、随机的数据中获取隐含在其中的潜在有用的信息和知识的过程。计算机取证数据挖掘技术可以发现、分析并出示计算机犯罪的未知信息。通过对犯罪属性分类、模式的发现、规则的提取实现计算机犯罪证据的数据挖掘。而广义数据挖掘是把统计数据建立在经验和直觉之上的组合数据挖掘方法,不是仅依靠不完全的数据分析。这样,就避免了大量的、不完全的、有噪声的、模糊的和随机的数据在大多情形下并不具有数据分析情况的出现。广义数据挖掘基本结构如图如下:
  二、建立数据应用平台
  (1)采用数据挖掘与在线分析技术、数据仓库相结合能够实现不同系统的共享和互联,用户访问信息变得很方便,一段时间的历史数据能够被决策人员用来分析,从而对事物发展的趋势进行研究。通过分析油田数据,建立适合于油田数据信息的数据挖掘应用平台,如下图:
  (2)建立油田生产数据仓库
  系统主领域的确定、数据建模是构建数据仓库的首要步骤,如在在井组生产中系统主题的确定是:油井生产受注水量的不同和层位不同的注采工艺的影响。其中注水井生产数据、油井生产数据、油井属性数据、生产时间等是分析中要应用到的数据,从而对每个主题的维度和事实进行确定,并且数据仓库的建立使用多维数据模型。在井组生产中,气油比、日产气量、日产液量等事实数据是决策者所关心的。数据的含义是多维数据模型所关心的,并且对分析领域的数据模型能够清晰的表达出来。所以应用多维数据模型来建立数据仓库的概念模型。在建立中首先建立的不是物理模型而是逻辑模型,物理实施在逻辑模型的指导来实现。确定数据源、定义关系模式、划分粒度层次等是设计逻辑模型的主要内容,其中粒度的大小需要兼顾查询分析效率和数据量的大小,并且对数据仓库的分析能力也要进行考虑。如下图是井组生产的多维数据模型:
  三、在处理油田信息中数据挖掘的过程
  (1)在油田信息中应用数据挖掘技术的时候,必须明确所要达到的目标和要解决的问题。针对数据挖掘的目标进行如下定义:对油田生产中的异常现象应用聚类分析法或分类分析法进行分析、如超注欠注、单量异常变化等。而且对泄露、异常井号及时发现,使生产出运行参数得到优化,确保油田经济、安全、正常运行;对数据之间的联系等利用时间序列分析、回归分析、相关分析等方法进行挖掘,能够检测出油田生产受到各变量的影响程度,便于融合油田分散的数据,对生产的指导也有很大的帮助;在油田生产经营中进行了信息化建设,生产经营的大量成果数据和历史数据得到了很好的积累,进行这些数据背后的知识的挖掘和提取可以采用兴趣模型来实现,对油田生产中的规律进行探索,对未来的生产情况、油藏开发指标等能够进行预测,从而在优化和调整生产方面起到更好的作用。
  (2)数据准备阶段在数据仓库中完成之后,接下来需要进行模型应用、建立模型、数据探索等工作。在数据挖掘工作中建立数学模型是核心环节,各种数据挖掘算法在这一模型中有效的集成,如贝叶斯预测、模糊聚类、神经网络、统计分析、决策树、关联规则等吗,通综合和比较多种建模方法来实现数学模型的建立,并且数据被分层为校验数据和训练数据,在模型检验主要使用校验数据,在求解模型参数中主要使用训练数据。在已经建立的模型中代入检验数据是模型检验阶段的主要任务,并且要对模型的响应进行观察,模型准确程度的评估是通过真实数据和模型相应的比较来实现的。倘若是比较差的模型准确性,那么就要建立新的模型、重新进行数据探索,指导新模型检验。所以,模型检验、建立模型、数据探索在实际应用中是反复迭代的过程。
  (3)在大量数据采集中选择训练样本,很可能出现数据误差,网络训练的准确性会受到一些明显矛盾的影响,网络识别的能力降低,所以必须有效的筛选训练样本,经过专家经验和用户对数据挖掘阶段发现模式的评价,剔除无关和冗余的模式,当用户的要求模式不能满足的时候,整个发现过程需要对数据进行重新选取,换一种算法进行再次挖掘,或对数据挖掘参数值进行重新设定、应用新的数据变化方法。通过图形化的方式把一些正确并有趣的模式呈现给用户。
  四、结束语
  在处理油田数据信息时,采用数据挖掘技术建立数据应用平台,对超大规模的数据进行集中挖掘,对油田的生产规律进行探索,提取对企业战略发展和业务决策有用的信息。油田数据信息处理中数据挖掘技术将有广阔的发展前景。
其他文献
【摘要】TD-LTE技术是新一代的移动通信技术,作为一种先进的技术,其发展应用对无线通讯行业的发展有着十分重要的作用和意义。本文简单介绍了TD-LTE无线网络技术,并通过与TD-SCDMA的比较,对TD-LTE无线网络的覆盖特性进行了分析,以相关的研究提供参考,从而促进这一技术的发展和应用。  【关键字】TD-LTE无线网络;覆盖特性;OFDM技术  【中图分类号】TN929.5 【文献标识码】A
【摘要】随着人类社会的不断进步,对高速公路信息化程度的要求不断提高,其中高速公路交通工程信息化资源管理趋于可视化和高效化。本文研究GIS技术在高速公路交通工程资源管理中的应用,利用Gls可视化技术,充分发挥其在空间分析等方面的优势,从而达到交通工程资源管理的可视化、资源使用效率高效化的目的。文章对GIS应用系统结构、功能设计和数据组织方法进行了研究,并提出了一个交通工程资源管理系统的解决方案。  
【摘要】随着计算机技术的不断发展和普及,很多企业单位为了方便管理,提高工作效率,都建立自己的局域网络,其中学校的机房管理就是非常典型的系统。而局域网内必定涉及很多的硬件资源,这些硬件是系统的基础,需要有一个完整的资源管理系统,保证系统的安全运行。本文简单介绍了局域网内计算机硬件资源管理系统的开发。  【关键词】局域网;硬件资源管理;系统开发  【中图分类号】TP309 【文献标识码】A 【文章编号
【摘要】本篇文章对移动通信的概念进行了详细的阐述,从移动通信的出现开始,它已经经历个很多个不同的发展阶段。到目前为止,移动通信已经普及到社会的每个角落,成为了人们学习、工作、生活的必需品。移动通信的问世,使人们的联系、出行、办公等各个方面变得方便、高速。本文通过对移动通信的种类特点、发展过程、应用、同社会活动的关系进行阐述和分析,探讨了未来移动通信的前景和发展方向以及系统的功能改进和技术挑战。  
【摘要】进入21世纪以来,飞行器在军事、民用和科学研究等方面得到了越来越多的应用,其功能越来越复杂,综合化程度越来越高。本文在分析CAN总线航天应用的基础上,从硬件原理设计、CPU与CAN总线接口实现以及CAN总线通信软件设计等方面进行了论述。  【关键词】CAN总线:航空系统:应用  【中图分类号】V243.1 【文献标识码】A 【文章编号】1672-5158(2013)04-0213-02  
【摘要】计算机网络的开放共享使得盗版越来越容易,人们重视版权保护的意识越来越强,数字水印技术作为保护版权的有力工具也融入了到人们的生活中。本文首先介绍了脆弱数字水印的发展背景和基本概念,接着分析并描述了脆弱数字水印独有的特性。最后从多媒体内容认证的角度出发,分析了现有脆弱数字水印方案以及技术路线的优缺点。  【关键词】脆弱数字水印;认证:算法  【中图分类号】TP309.7 【文献标识码】A 【文