随机森林类算法在地球物理勘探中的相关应用技术研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:catva
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在石油勘探开发领域,对测井、地震等应用地球物理数据的反演和解释是确定地下储层性质、进行区域开发潜能评估的主要途径。传统解释技术往往都需要预先进行理论假设和模型假设,难以保证结果的客观性与准确性。近年来,随着大数据与人工智能技术的兴起,以数据驱动代替理论驱动、以机器学习代替理论推导为应用地球物理解释提供了一种全新的思路,而如何使用各类机器学习技术有效辅助地球物理数据解释亦成为当前的研究热点之一。在众多机器学习算法中,随机森林被证明具有学习能力强、算法健壮性高、高维自适应等诸多优点,现已被成功应用于众多工程领域。但就目前而言,其在地球物理解释中的具体应用尚处于探索阶段,尚缺乏系统的研究和总结。本文以地球物理解释中的测井地层岩性判别、测井储层参数预测及地震河道砂体识别等任务为例,深入分析各项任务的问题特点,有针对性地提出典型响应相似性随机森林分类、局部线性随机森林回归、后剪枝随机森林分类等流程及方法,有效提高了随机森林在地球物理解释中的应用效果、为具体的地球物理解释任务提供了相应的优化解决方案。具体而言:(1)针对测井地层岩性判别所面临的样本分布模式复杂多变、难以进行形式化表征等的问题,通过将随机森林分类算法与Mean-Shift算法相结合,提出了一种基于测井响应相似性的随机森林地层岩性判别流程。该流程根据由Mean-Shift算法所提取各岩性的典型测井响应集合,进而构建典型测井响应相似性特征作为输入,并据此使用随机森林分类算法来建立最终的测井地层岩性判别模型。不同油田9个区块上的实际应用表明,较之于其它基于机器学习测井岩性判别方法而言,使用该流程能够显著提高测井地层岩性判别的准确率、进行更有效的测井地层岩性解释。(2)针对测井储层参数回归建模中的样本有限、数据噪音大、待拟合函数形式特殊等具体特点,通过将M5线性决策树与随机森林回归算法相结合,提出一种线性随机森林回归算法来进行求解。该算法以局部线性模型取代传统随机森林中的局部常数模型,首先使用随机化M5线性决策树拟合出一系列分段线性模型,而后使用Bagging框架进行集成来增强模型的稳定性、健壮性与平滑性。在6个区块上的23个测井回归建模任务上的应用表明,较之于其它常见机器学习回归算法,线性随机森林算法能够有效降低各类储层参数的回归预测误差,同时具有样本需求量小、算法健壮性强、拟合模型形式合理等优点,更适用于解决各类测井储层参数回归建模预测问题。(3)地震河道砂体识别任务可转化为一个机器学习分类问题进行求解,但其面临着数据误差强、输入特征维度高、存在大量无关和冗余输入信息等问题。针对上述问题,本文通过将决策树后剪枝过程提出随机森林分类模型的构建之中来进行改进。对于剪枝随机森林中每棵树的构建,全部样本被随机二分为训练集和剪枝集,首先基于训练集得到完全生长的随机化决策树模型,而后基于剪枝集对其进行后剪枝处理以提高准确性和健壮性。通过在西渤海地区某工区的实际应用表明,剪枝随机森林算法在简化了随机森林算法参数优选过程的同时,进一步提高了拟合模型的准确性、健壮性和特征选择能力。较之于其它同类机器学习分类算法,所引入的剪枝随机森林算法在解决地震河道砂体机器学习识别问题上具有明显的优势。
其他文献
番茄(Solanum lycopersicum)作为生物学的模式植物,是世界性的重要蔬菜,在我国的蔬菜产业中占据了重要的地位。本研究从番茄植株抗逆和果实抗软化两个方面进行了研究,并取得进展。番茄抗逆研究方面,一直以来都是番茄研究中的重要领域。热激蛋白Hsp70在番茄对高温的抵御过程中发挥了重要的作用。本研究通过酵母双杂交调取番茄中热激蛋白70(Hsc70.1)的互作蛋白Lrg B,通过转基因验证,
梓叶槭(Acer catalpifolium Rehd.)属于无患子科(Sapindaceae)槭属(Acer),一种多年生落叶阔叶乔木树种,主要分布于四川成都平原西北边缘的华西雨屏区,属于国家II级保护植物。由于其分布区域极其狭窄且野外数量极少,被国家林业和草原局列入“极小种群野生植物(Wild plants with extremely small population(WPESP))”名录。
树木生长对气候变化的响应研究是预测未来气候变暖对森林生态系统影响的基础,是近几十年来生态学研究的焦点之一。树木生长受气候条件和林分因子的共同作用,但过去在的大尺度上开展的树木年轮研究很少考虑林分因子结构的影响,树木径向生长对气候变化的响应关系在大尺度上如何变化、气候和林分因子的相对作用大小并不清楚。本研究利用树轮生态学的研究方法,分别对长白山海拔梯度、东北阔叶红松林分布区的纬度梯度上以及中国北方主
学位
学位
目前发现的西周诸侯国遗址分布各地,与文献中记载的西周时期诸侯国林立的情况较为相似。考古发现的西周诸侯国遗址往往是通过墓葬材料中的国属铭文加以确认。这些国属铭文一般出现在国君墓葬中,并且国属铭文之后,通常会有称谓铭文来确定国君的身份。然而在不同的诸侯国遗址中发现的国君称谓会有所区别,常见的包括“侯”“伯”“公”“子”等;这样的现象与文献中记载的五等爵制又具有相似性,而五等爵制与诸侯国等级地位有明确的
柑橘因根毛稀少主要依赖与丛枝菌根真菌共生来吸收水分和矿质营养,因此研究柑橘丛枝菌根共生形成的分子机理具有重要的理论和实践意义。本研究以柑橘常用砧木枳(Poncirus trifoliata(L.)Raf)为材料,分析了柑橘丛枝菌根共生形成过程的转录组变化;评估了木本植物柑橘与四种草本菌根植物响应菌根共生分子机制的保守性,并以苜蓿模式植物为材料,利用反向遗传学手段鉴定了参与菌根形成的关键基因。此外,
随着全球气候变暖,高温天气频繁出现,由此引发棉花雄性不育,进而导致产量降低。高温造成棉花雄性器官发育异常进而导致雄性不育的现象普遍存在,但是其分子调控机制仍不清晰。本实验室在前期研究中已鉴定到高温胁迫下在花药绒毡层细胞和小孢子中提前表达以及延缓绒毡层细胞程序性死亡导致花药不开裂和雄性败育的酪蛋白激酶基因GhCKI。本研究进一步针对棉花CKI基因家族的系统进化以及调控GhCKI基因在高温胁迫下花药早
我国柑橘栽培面积和总产量居世界首位,柑橘已成为我国第一大水果。据报道,巴西、美国等近几年因黄龙病造成柑橘大幅减产,而中国柑橘产量的增长在稳定世界柑橘总产量中起到了重要作用。在我国柑橘产区,柑橘大实蝇Bactrocera minax是柑橘果树的重要害虫,由于气候变暖及果蔬贸易频繁,柑橘大实蝇的发生为害逐年加重,影响柑橘产业的健康发展。柑橘大实蝇一年发生一代,蛹冬季滞育长达6个月,阻碍了其基础和应用研
茶树是一类重要的经济作物,但其在生长过程中会遭遇多种病虫危害和非生物胁迫,这些逆境严重影响了茶树的生长发育和经济效益。WRKY转录因子和VQ基序蛋白在植物的生长发育和调控逆境防御机制方面具有重要的作用。本文从‘龙井43’中鉴定了9个WRKY转录因子和15个VQ基序蛋白,研究了它们响应不同逆境的表达模式,并分析了‘舒茶早’基因组数据库中WRKY转录因子和VQ基序蛋白家族成员的数量以及相互作用。通过模