基于集成学习的套损井预测方法研究

来源 :东北石油大学 | 被引量 : 0次 | 上传用户:sadsorry11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据油气生产过程中的套管损坏影响因素众多、数据复杂等特点,通过数据预处理、随机森林重要性分析等技术对现场数据进行分析与整合,采用特征工程的方法处理缺失值并选取特征参数。针对传统机器学习模型对套损预测不佳的问题,提出基于Stacking思想的集成学习预测模型;该模型采用随机森林、支持向量机、梯度提升决策树和K近邻算法为基模型,逻辑回归为元模型,以此构建泛化能力更强的套损预测模型。结果表明,该模型较于单一的机器学习模型准确率与F1值均有提升,该模型最终的准确率达到89.21%,主要研究内容如下:1.数据预处理通过对影响套管的主要参数进行了研究,并根据现场的专业技术人员的工作实践,对其进行了归类。引发套损的原因主要可以分为地质因素、井身因素和生产性因素。因为油田的工况、井下作业等多种原因很多数据存在大量的缺失值,在处理缺失值问题的时候需要综合考量一般有删除、替换与插补三种处理方式;大量的油田生产数据中存在着部分异常值,本文采用箱线图的方式界定异常值并处理异常值;由于正负样本的不均衡性采用SMOTE算法平衡数据集。2.特征参数选取对油田现场提供的生产数据进行数据预处理后,采用方差过滤、互信息法、Wrapper包装法以及随机森林特征重要性评估进行数据降维,随机森林中的特征重要性表示在该特征上拆分的所有节点的基尼不纯度减少的总和。最终得到对套损更加敏感的特征参数分别为:完好年限、月生产天数、月注水量、配注比、油压、套压、套管钢级、砂岩厚度、射孔厚度、地层倾角。3.预测模型的建立本文采用Stacking模型利用树形的计算方式将多种异质学习器组合形成预测模型,实验建立了一个两层集成学习模型。第一层选用SVM、RF、GBDT、KNN四种模型作为基模型,第二层选取LR作为元模型。针对相同的数据,该集成模型集成了多种不同的基模型,Stacking方法为每个基模型赋予权重,提高了元模型训练数据的可靠性,每个基模型都有自己的优点和侧重,因此具有很好的泛化能力和抗干扰能力。4.套损预测系统的实现完成了基于集成学习的套损预测系统开发。用户将油田数据文件提交至服务器后系统调用Stacking套损模型进行套损预测并将最终结果返回至前端界面,系统也可以根据预测结果给出一些相应的预防措施。本系统面向油田领域,将Stacking集成学习方法与油田生产相结合,旨在为治理套损井提供有效的辅助信息。
其他文献
随着人类对太空探索的不断深入,作为空间任务的重要工具,空间机器人扮演着着越来越不可或缺的角色。近年来,太空变得越来越拥挤,失效航天器、太空碎片不断增多。因此,对于非合作目标的捕获成为了空间机器人的重要任务之一。本文的研究内容为空间机器人在非合作目标捕获时的规划算法,包括非合作翻滚目标运动状态估计及预测、机械臂最优捕获路径规划及关节空间最小扰动运动规划的相关研究。本文研究了非合作翻滚目标的状态估计及
学位
我国航天技术不断发展,对地球同步轨道中失效航天器的在轨维护将是一个绕不开的有待研究攻克的课题。失效航天器属于非合作目标,多处于一种复杂的翻滚运动状态,这是对失效航天器抓捕的重大考验。本文在采用冗余空间机器人对失效航天器进行抓捕的方案下,研究了非合作目标的运动预测以及空间机器人跟踪非合作目标的具体方法。非合作目标上没有合作的测量靶标,很难对其运动状态进行测量描述。为解决此问题采用三线结构光视觉系统,
学位
随着无线通信技术和智能终端的发展,无人系统在许多领域中都扮演着越来越重要的角色,近年来无人驾驶汽车和智能仓储系统的发展更是突飞猛进。这些无人系统都需要依赖定位和导航来完成工作。然而在室内情况下,定位信号的严重衰减和多径效应会对定位造成严重影响。超宽带定位技术以其穿透能力强、脉冲短等特点在室内定位技术中展现出了一定的优势。同时,多种传感器融合定位是一种相对来说更廉价的提高定位精度的方法,因此本文提出
学位
井控作为油田安全生产的重要一环,其职工的井控知识考核不仅是筛选优秀人才的重要方式,还是保障职工生命安全和公共财产安全的基础。随着计算机技术的发展,智能化考试已成为井控知识考核的发展趋势。由于智能考试中涉及的自动组卷、客观题自动阅卷等功能的实现目前已不存在技术难题,所以如何实现面向油田井控领域主观题自动阅卷便成为考试智能化的研究重点。主观题自动阅卷在减少人工成本的同时,又能有效避免因阅卷者的主观因素
学位
随着大数据、人工智能、物联网、云计算等信息技术的发展,科技馆的参观服务、教育传播、展品管理、设备运营等内容都随之发生了巨大变化,同时也促进了智慧科技馆的发展建设。科技馆源于博物馆,文章通过对智慧博物馆的发展研究和智慧科技馆的展览展品、教育活动、观众服务、设备运行、安防保卫、办公政务和人财管理方面的智慧建设需求进行分析,提出了智慧科技馆建设需要具备的功能,阐明了智慧化建设对科技馆的作用。
期刊
在我国能源转型的大背景下,电动汽车将会迎来新的发展动力。同时,伴随着电动汽车智能驾驶技术和大功率快充技术的不断进步,自动化的电动汽车充电模式将成为大势所趋。电动汽车自动充电技术中涉及到的充电接口的插接问题类似于轴孔装配问题,但是电动汽车充电插头和插口较一般的轴孔结构更加复杂,给视觉定位和插接造成了一定困难。此外,为了保证插口使用寿命,充电过程中的接触力不能过大。针对以上问题,本文设计了一个电动汽车
学位
有效保护和合理开发海洋资源成为了多国面向二十一世纪的新目标。为了应对新的世界形势,我国也加快了针对海洋的战略部署来维护海洋权益。对海洋资源信息的采集和处理不仅可以了解生物资源的生长情况,也可以对海底的能源进行探测以及监测输油输气管道或输电线路的运行情况,同时也可以对水雷、潜艇等军事设施进行观测。因此海洋信息的采集和处理对开发利用海洋资源有着至关重要的影响。但目前针对海洋的目标检测领域研究较少且并没
学位
近年来,无人机的发展成为国内外研究的热点,现有构型的无人机包括固定翼无人机,单旋翼直升机和多旋翼无人机。共轴双旋翼无人机属于多旋翼无人机,该无人机的特点在于横向尺寸较小,体积小,适合多平台多空间应用,桨叶共轴反转实现扭矩平衡,机动性强控制简单,使用两个电机提供升力相比四旋翼消耗能量更少,具有较强的续航能力和带负载能力。本文在实验室已有共轴双旋翼无人机的基础上,参考国内外设计方案,对比各种方案的优缺
学位
城市中人员密度大,灾害会造成更大的人员伤亡和财产损失。灾害发生后短时间内开展搜救活动可以大幅提高受灾者的获救概率,但是灾后城市环境复杂,不利于救援工作的展开,为了协助救援人员尽快开展搜救活动,搜救机器人的研发异常迫切。复杂危险的城市灾后环境,对搜救机器人提出更全面的要求。本文以城市灾后搜救任务为背景,以高机动性、越障性能及抗摔落性能为目标,研制了一款更高适应性的轮式搜救机器人,并对其地图构建技术进
学位
随着载人航天技术的日益发展,中国空间站顺利拿到通往太空的通行证,空间站运行期间需要灵活的机械臂配合末端执行器提供在轨维护、在轨装配及性能升级等在轨服务。末端执行器作为在轨服务的关键环节,投入成本巨大,风险系数高,为了确保太空服役时捕获可靠性,地面捕获性能测试是必经阶段。为了地面模拟末端执行器空间捕获过程,检测末端执行器在工作环境中的捕获容差性能,本文基于半物理仿真的方法研制了一套末端执行器捕获容差
学位