数据挖掘方法在石油勘探开发中的应用

来源 :中国化工贸易 | 被引量 : 0次 | 上传用户:dongnoh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着老油田进入开发中后期的高含水阶段,其低空低渗、低阻、水淹层等复杂储层的特性,使常规交会图、线性回归、多元判别分析等原有许多传统应用方法无能为力,同时实践表明,在面对多种因素影响下的复杂石油地质问题时,非线性神经网络方法非常高效。因此,引进人工智能,建立机器学习、模式识别等新方法显得十分必要。本文从数据挖掘方法与技术切入,重点介绍了数据挖掘方法在石油勘探开发中的应用,并通过具体例子,给与详细说明。
  关键词:数据挖掘 方法 石油勘探开发 应用
  一、数据挖掘方法以及技术
  “从海量的数据中获取正确、新颖、有潜在价值、最终可理解的模式的非平凡过程。”便是数据挖掘。其任务主要有两方面:其一,数据描述;其二,数据预测。前者主要是通过海量信息的刷选导出潜在关系的数据进行概括的模式,后者是通过数据描述与潜在关系的分析,推断出所需的关键结果。数据挖掘的主要有概念描述、关联分析、预测建模、聚类分析、异常检测、演化分析等功能。数据集作为数据挖掘的对象,通常有记录、向量、模式、样本、数据点等方式,表达时可以用一组刻画对象属性的基本特征(如变量、特征、字段、参数、维等)进行描述。而预测时,则是凭借部分已知属性,通过相应模型,得出制定属性即目标变量。对于预测建模,便是对已知类标号的训练样本(输入数据)研究学习,得出目标函数方程式,继而将数据集中所有属性值映射至预先定义的类标号,若类标号为沉积微相、水淹级别解释结果等离散型,则被定义为分类,若是类标号为含油饱和度、孔间隙等连续型,则被定义为回归。预测建模通过对某种算法的学习,建立分类模型,以尽量建立高泛化能力模型,最终为精确的预测测试样本即位置样本提供帮助。
  二、数据挖掘方法在石油勘探开发中的应用
  1、数据挖掘方法在石油勘探开发中的应用流程
  在数据挖掘中,石油勘探开发中储层参数如常见的孔、渗、饱等计算通常与预测建模中分类任务对应,而油水层识别层等问题与预测建模中的回归任务对应。无论是分类还是回归任务,其均与模型中“过学习”与“欠学习”息息相关,因此为了使在未取心或者未射孔井段的准确率得到有效提高,数据挖掘应用流程通常由九个步骤组成。第一步,针对所要调查的石油地质与开发问题,最大限度的收集与其相关的各种项目资料,但须保证资料真实可靠,数据无较大出入。第二步,对于数据进行预先处理工作,如补齐缺失数值、消除异常等明显不合理数据等将资料整体进行标准化与归一化处理。第三,构造新的评价体系以适应要解决的问题。第四,对于性能方案评估并予以确认。第五,对于特征组方案评估予以确认。第六,结合石油勘探开发过程中要处理的问题特点、算法的特点,明确建模方案组合。第七,着手开始挖掘数据。第八,比较各种建模的特征与结果,得到最优模型,结合地球物理、石油地质、油藏工程等专业知识进行分析说明。第九步,现场检验,通过结果反馈,进一步改进模型参数与特征组合。
  2.数据挖掘方法在石油勘探开发中的关键技术环节
  受模型代表性、模型復杂度、算法等诸多因素的影响,模型泛化能力在关键技术方面的选择至关重要,其主要存在五个环节。第一个环节,激活决策树中剪枝操作、人工神经网络(即ANN)中的提前终止学习、SVM中的惩罚因子等预测建模方法算法设计中相关涉及泛化问题所引入的操作,并对参数设置进行优化处理。第二个环节,若是有不相关的特征或者冗余则会因为过度拟合的发生而对结果产生不利影响,所以,需要使用自动化或人工经验等特征选择方法进行特征选择,从而对几种方案进行对比。第三个环节,对模型中预测性能进行估计和比较,对于不同分类器的性能理论进行比较没有答案。通常在实践中,当数据集足够庞大,一般会将它一分为二,划分出独立的训练集与测试集,而分类器的性能在测试集中估计。当数据集规模较小比较有限时,为避免因数据不足发生“欠学习”的现象,一般不对训练集与测试集进行独立划分,通过对整个数据集使用交叉验证来进行性能估计。第四个环节,按照O ccam剃刀(razor)原理,对两个相同泛化误差的模型选择上,相对比较简单的更加优化,但是,对最终结果需要进行统计检验。第五个环节,在优化模型选出以后,应用全部数据重新建模进行训练,并将所得到模型应用于油田现场。
  3.数据挖掘方法在石油勘探开发中的特征选择和模型应用
  三、数据挖掘方法在石油勘探开发实践中的具体应用
  1.水淹层特征参数的提取与特征方案的选择
  本应用实例为国内某油田,分析该地区密闭取心井的岩心资料、测井曲线、石油结论、产液剖面等,发现此地区对水淹级别比较敏感的有产水率、含有饱和度以及采出指数。因此,这三个数据将作为水淹层特征参数。而对于特征选择,本次主要拟定了六套方案,分别为(1)人工方式确定三种,(2)过滤工作方式一种,(3)单因素方差分析方案一种,(4)全部23中参数方式。
  2.建模方法及其参数设置
  本次建模选取神经网络、支持向量机、贝叶斯网络、组合学习以及决策树共五种方法十二中模型。因为模型数据较少,故采用重复交叉验证估计模型的预测性能。各种方法参数如下设置。第一,对于决策树,采取自顶向下递归分治法(贪心算法),一般分为两个步骤进行分别为树的生成、树的剪枝。对于神经网络,其数值输入属性将进行归一化,区间为[-1,+1],层位属性变化为八个二值属性。共设计BP与RBFN两种网络。对于支持向量机,其输入的属性预处理和神经网络一样。对于贝叶斯网络,其算法采用NB和TAN两种。对于集成学习,采用BP与C5.0两种方案,算法采取A daBoost。
  3.算法比较以及选择
  通过借助开源数据挖掘工作平台为Weka与RapidMiner,对以上十二种算法在六种特征方案进行准确率交叉验证,得出:决策树在整体上性能最优,尤其是C4.5与CART效果最好,而两种贝叶斯算法性能最差,在所有特征方案中准确率都在百分之七十以下,两种神经网络算法与支持向量机算法中规中矩。此外,组合方法要优于单独分类器方法。通过分析可以明确得出结论:在水淹层识别和评价样本中基于结构风险的最小化原则的C 4.5+YC的应用效果最佳。
  四、结语
  虽然数据挖掘方法作为未来应对石油勘探开发挑战的十项主要关键技术的一种,其在国外已经被成功应用,如油藏实时动态监测、油藏描述、识别石油工程作业中的“最佳实践”等方面,但与其在金融、银行、交通等其他领域应用进行横向比较,数据挖掘在石油勘探开发中却处于刚刚起步阶段,因此,如何更加科学合理的利用这项技术,使数据挖掘在石油勘探开发的应用更加深入、更加广泛,还需要我们共同努力。
  参考文献
  [1]谭锋奇,李洪奇,孟照旭,郭海峰,李雄炎. 数据挖掘方法在石油勘探开发中的应用研究[J]. 石油地球物理勘探,2010,01:85-91+164+172
  [2]汪忠德,王新海,瞿建华,方海飞,刘洪. 数据挖掘技术在石油勘探与开发中的研究及应用[J]. 石油工业计算机应用,2007,01:17-20+63
  [3]赵改善,李剑峰,王于静,韦海亮. 网格计算技术及其在石油勘探开发中的应用前景[J]. 石油物探,2005,05:413-420+15
  [4]易昌华,陈继红,韩华,李春芬,耿少波. 网络地理信息系统在石油勘探开发中的应用研究[J]. 石油地球物理勘探,2003,S1:77-80+138
  [5]王海兵,樊硕,朱建民,李爱霞. 计算机技术在石油勘探开发中的应用[J]. 电子技术与软件工程,2013,12:117
  [6]谢天虎. 计算机网络技术在石油勘探开发中的应用研究[J]. 中国新技术新产品,2012,11:43
  作者简介:野 男 采油专业 辽河油田兴隆台采油厂 124010 1986.09
其他文献
随着仪表自动化及信息技术的发展,我国大部分油气集输中转站上的大型储罐液位仪表,由传统的机械式现场操作测量的方式逐步向智能化测量方式进行技术改造,本文详细介绍了大型储罐
摘 要:随着现代电子技术的不断发展,PLC和DCS技术在化工、电子行业等备受关注,其使用率逐年上升,随着技术的不断发展PLC和DCS的功能也在不断的发生着变化,由于是两种不同的模块其功能的实现也不相同,从设计理念和处理能力来看,选取PLC和DCS控制系统的优劣上需要进行不断的研究,否则难以对其正确的选择做出准确的判断。本文主要对PLC和DCS的模块进行基础介绍,然后结合当前的技术将其进行功能区分,
为了能够更好地在全市范围内推动有线电视数字化试点工作,丰富数字广播功能的视觉享受,从2007年8月起,文明杂志社与实施全市有线电视数字化试点工作的北京歌华有线电视网络股
摘 要:本文主要通过分析现阶段石油工程建设中现代化信息技术应用现状及其问题,之后探讨了现代信息技术在石油工程建设管理中的应用体现,从而大力推广和充分利用现代信息技术,加快信息化建设,不断提高企业的经济效益和社会效益。  关键词:石油工程建设 现代信息技术 应用  现代信息技术的推广和广泛应用,促进了石油工业等各个领域信息处理技术更加高度集成化和数字化,提高石油工程建设项目管理水平,优化了石油勘探开
摘 要:本文首先介绍RFID技术的基本概念、组成、及工作原理,其次对我国仓储物流也的发展现状进行分析,以此为基础提出了利用RFID技术,提高仓储物流企业的工作效率。  一、RFID技术介绍  (一)基本概念及组成  射频识别技术(Radio Frequency Identification, RFID)是一种非接触式的识别技术,其基本原理是电磁理论,是利用电磁能量实现自动识别与数据采集的技术。  
摘 要:随着社会经济的快速发展以及计算机技术的不断更新,全面到来的数字化时代正在不断地改变着社会的生产方式。数字油田建设从低级到高级分别是数字化阶段、网络化阶段、可视化阶段、自动化阶段和智能化阶段,尤其对于延长油田的建设和发展来说,全面实现数字化管理则能够大大地提高生产效率,更好地解放劳动力,最终实现工作流程高度规范化、处理一体化,经营管理科学化和最优化,领导决策智能化,使油田整体效益、管理水平和
摘 要:作为油气储运中的重要应用技术,自动化技术对于提高油气储运的效率具有重要作用。本文首先对油田油气自动化系统进行分析,然后介绍了罐区自动化的作用,最后具体探讨了自动化控制的应用,以期为相关技术人员提供参考。  关键词:自动化技术 油气储运 应用  随着现代信息技术的迅猛发展,油气储运工作对于信息技术的应用需求也越来越高。由于自动化技术能够实现对油田油气生产过程的智能控制、集中管理和实时监控,所
提高思想政治课教学质量,必须在“高效课堂”上做足文韋,努力构建“导学-激趣-研学-促能”的生态,智慧课堂教学模式,让学生放飞思维,展示精彩。以学生发展为本,构建发展学生
中国证监会2002年发布的第一号文件是《上市公司治理准则》(以下简称《准则》),这将对规范上市公司运作、完善治理结构、推动上市公司建立现代企业制度和保护中小股东权益等方面产生
摘 要:本文阐述了袋式除尘器工作原理和特点,进而分析了我国燃煤电厂袋式除尘器应用中存在的问题,再进一步探究袋式除尘技术的发展和应用前景。  关键词:袋式除尘器 燃煤电厂 发展  引言  燃煤电厂对除尘器类型的选择与本国的烟尘排放标准密切相关。随着烟尘排放标准的日趋严格,对除尘器类型的选择逐步由机械除尘器、文丘里水膜除尘器到高效的静电除尘器,再到袋式除尘器。我国国家环境保护总局和国家质量监督检验检疫