基于机器学习与缺失值插补技术的海底硫化物成矿定量预测

来源 :吉林大学 | 被引量 : 0次 | 上传用户:gjpttkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用传统深海探测技术进行海底多金属硫化物勘查不仅难度大且成本高,这导致已发现的热液区与采集到的与热液成矿相关数据较少。为缩小勘探范围从而提高找矿效率,在实地勘探前,我们需要一种既适用于小样本,又能使特征变量充分体现找矿信息的成矿定量预测方法。如今一些传统的统计学方法已应用于海底多金属硫化物成矿预测,但这些方法无法满足上述要求。机器学习算法具有可以同时将二分类、多分类和连续数据作为特征变量的优势,而且用作特征变量的数据不需要进行任何预处理(例如归一化),其中随机森林与孤立森林模型两种机器学习模型都是通过构建多颗二叉树形成森林的集成算法,它们不仅适用于对小样本数据的成矿预测,并且模型性能优于其他算法。本文基于随机森林与孤立森林的特点提出了基于随机森林与孤立森林的联合应用模型,该模型利用模糊逻辑算法中的模糊算子将随机森林与孤立森林两种模型的预测结果相结合。本文以西南印度洋48.7°—50.5°E洋脊段为研究区,基于热液成矿相关的地形、地质、地球化学、水体特征变量应用基于随机森林与孤立森林的联合应用模型开展了成矿定量预测,并对该模型与传统证据权法模型圈定的远景区进行评估对比。为进一步缩小勘探范围,本研究在西南印度洋48.7°—50.5°E洋脊段圈定的远景区中选择成矿概率最高且数据相对丰富的龙角区作为重点区进行进一步的成矿定量预测。龙角区与西南印度洋48.7°E—50.5°E洋脊段的数据相比,已知热液区更少且多个特征变量存在缺失值,如何把存在数据缺失的图层在海底热液多金属硫化物成矿预测中加以应用是值得探索的问题。目前已有多种成矿预测方法可以处理缺失数据,例如证据权法、综合证据权法、模糊逻辑法等,以上方法在陆地矿产预测中均取得了较好的效果,但海底数据缺失情况较陆地更为复杂,具体表现为数据缺失面积大,不同的图层缺失数据所处位置不一致,多个图层同时存在数据缺失的问题,并且由于大洋调查程度低导致已知矿区少,这更加加大了矿产预测的难度。因此针对大洋数据的特点,我们需要探索出一套既能处理缺失数据,又能在已知矿区少的情况下进行成矿预测的方法。为解决以上问题,本研究提出了将MICE多重插补法与孤立森林模型相结合的预测方案,并将该方案的预测结果与直接使用模糊逻辑模型,以及仅对插补前完整数据集利用孤立森林或模糊逻辑模型的预测结果进行了对比。本研究取得的主要研究成果如下:(1)根据超慢速扩张洋中脊海底多金属硫化物的矿床成因,搜集热液区、水深、地质和热液羽流异常数据,采用叠加分析和缓冲分析对数据进行分析,提取与海底硫化物成矿直接或间接相关的信息,总结找矿有利条件并建立了西南印度洋48.7°E—50.5°E洋脊段多金属硫化物成矿定量预测找矿定量预测模型。(2)本研究提出的基于随机森林与孤立森林的联合应用成矿预测方法是一种利用模糊逻辑原理中的模糊算子将随机森林与孤立森林的预测结果相整合的机器学习模型。基于随机森林与孤立森林的联合应用模型不仅适用于小样本,而且允许根据各指标对成矿指示方式的不同同时将二分类、多分类以及连续数据用作特征变量使其能最大程度的体现成矿信息。(3)利用证据权模型与联合应用模型进行成矿定量预测中的特征变量重要性排序表明,基于随机森林与孤立森林的联合应用模型与证据权法得出的前10个重要特征变量一致,因此大型断裂(E型断裂、拆离断层)、洋壳厚度和洋脊轴是西南印度洋48.7°E—50.5°E洋脊段多金属硫化物重要的找矿标志。(4)我们将利用基于随机森林与孤立森林的联合应用法圈定的远景区与基于证据权法圈定的远景区叠加发现基于随机森林与孤立森林的联合应用模型相比证据权法对远景区的圈定更精确。因此本研究将基于随机森林与孤立森林的联合应用模型圈定的8处远景区作为西南印度洋48.7°E—50.5°E洋脊段多金属硫化物成矿定量预测最终的远景区。(5)根据龙角区数据集的缺失机制、缺失率和缺失模式,在完整观测数据集上进行缺失值模拟,利用目前最认可的k近邻、miss Forest和MICE多重插补法对模拟的缺失数据集进行插补,对以上3种方法在本研究缺失数据集上的插补性能进行了比较。结果表明MICE多重插补法的表现明显优于其他两种方法,因此将利用MICE多重插补法对原始数据集中的缺失值进行插补。(6)针对龙角区多个特征变量存在缺失值且缺失率接近50%的特点,本研究提出了将MICE多重插补法与孤立森林模型相结合的预测方案。该方案比直接利用模糊逻辑模型取得了更好的预测效果,且将含有缺失值的图层加入数据集有助于提高成矿定量预测的准确性。(7)将利用MICE多重插补法与孤立森林模型绘制的成矿潜力图作为龙角区成矿定量预测的最终结果。龙角区已知5处热液区均包含在成矿概率高值区内,无已知热液区的西南处高值区可作为后续重点勘探目标。
其他文献
固态荧光光开关材料能够在外界特定波长光的照射下实现颜色和荧光强度、荧光颜色等性质的可逆变化,因而在防伪涂料、光学信息存储介质、荧光成像生物探针和超分辨成像染料等领域展现出巨大的应用价值,受到了众多科研工作者的关注。基于螺吡喃的固态荧光光开关材料的研究已经取得了一些瞩目的进展,但在聚集态中分子的排列方式和分子间的相互作用复杂多样,不可控的聚集态分子结构会导致其光致异构过程及发光性质不稳定。因此,目前
我国是自然灾害事故频发的国家,现有应急救援车辆多采用被动悬架,其行驶速度低、平顺性差,难以满足对应急救援车辆快速响应的要求。和被动悬架系统相比,主动悬架系统可以使得车辆的行驶机动性能有较大提升。但由于信号采集、作动器响应等因素的影响,将会导致系统出现控制迟缓的问题,提升效果受到了一定限制。若能提前进行地形预瞄,便可对悬架系统进行超前控制,进而实现提高车辆行驶平顺性的目的。本文结合国家重点研发计划课
为进一步阐明山茄子(Brachybotrys paridiformis Maxim.ex Oliv.)的化学成分,寻找和开发天然有效成分,本论文在综述山茄子以及溃疡性结肠炎(Ulcerative Colitis,UC)研究进展的基础上,对山茄子的化学成分、抗溃疡性结肠炎生物活性以及活性成分的药代动力学进行了研究。主要包括:基于活性导向的山茄子化学成分的分析、分离与鉴定;基于网络药理学和分子对接筛选
矿业是国民经济的重要组成部分,露天采矿占整个矿山开采业的比重很大。矿用大型电铲是露天矿山剥离和采掘矿石的主要设备,其工作环境恶略,再加上操作员长时间工作,使得电铲事故率较高。其中,与行走装置有关的事故占到1/3左右,由此可见行走装置对于大型电铲性能的可靠性具有重要影响。随着矿产装备智能化水平的不断提升,无人电铲成为新的解决方案。其中,自主行走是无人电铲一项关键功能,该过程存在机电耦合、离散介质系统
5G/B5G无线网络不同场景中新业务骈兴错出,需要通信系统提供定制化的可靠性保障。时延约束下的可靠性,即网络时延低于业务时延阈值的概率,是衡量网络性能的重要指标,可指导网络控制,直接影响用户体验。统计型时延可靠性保障是5G/B5G网络走向成熟必须直面的问题。合理的带宽分配是可靠性保障的充要条件。受毫秒级时延的约束,实现业务严苛的可靠性保障需要网络的大带宽供应。精确的带宽需求评估和抽象决定了资源的高
近年来,随着科学技术的发展,农业进入了4.0时代,国家也出台了一系列文件来促进农业向智能化、精准化方向快速前进。但农业数据采集成本高、决策模型不足、智能化程度低等原因,造成了农业生产过程中土地产出率、资源利用率和劳动生产率较低等问题。本研究针对玉米精准施肥决策中土壤采样成本高、土壤氮磷钾含量获取难、模型长期预测精度降低的问题和玉米施药决策中没有玉米病害发生程度识别模型的问题,构建了基于改进BP神经
碳基共晶材料是指由两个或两个以上碳基分子构成的共晶材料,这类材料不仅可以继承单组分的优异物理化学性质,还可以因为分子间相互作用而产生新的性质,因此受到人们的广泛关注。作为一种重要的热力学参量,高压可以有效改变分子间相互作用,使共晶材料产生新的结构和性质,为创造新型功能材料开辟一条新的途径。目前,在碳基共晶材料的高压研究方面已经取得了一系列重要进展,具有新奇结构/性质的新物质已被设计合成出来,如从富
近年来,以“双碳”目标为代表的节能减排政策为新能源工程机械产业带来了新的机遇和挑战,工程机械领域电动化趋势发展强劲。装载机是工程机械的重要机型,作业范围广阔、市场保有量大。电动装载机避免了传统燃油装载机使用过程中的碳排放和尾气污染问题,从战略发展,技术储备和供应市场等多方面看,电动装载机关键技术的研究具有重要理论意义和工程应用价值。装载机作业过程中环境恶劣、路面复杂、铲掘和装载前后负载变化大、前后
汽车产品在市场竞争中核心技术要素主要包含可靠性、稳态工况下的性能、瞬态工况下的动态性能,以及批量生产过程中的上述性能的产品一致性、使用一段时间后上述性能的衰减。经过几十年发展,我国已经完全掌握了可靠性和稳态性能的开发技术,自主汽车品牌的相关性能指标已经达到了国际一流水平。我国自主品牌汽车急需提升产品的动态性能及其量产一致性和性能持久性。目前,产品瞬态工况的动态性能只能通过实车场地试验主观评价进行开
传统半导体材料为光电领域的发展做出了卓越贡献,但随着后摩尔时代的到来,对光电信息等系统提出了更高的需求,光电子器件也朝着小体积、大带宽、低功耗、集成化、智能化等方向发展,促使科研人员不断探寻新材料、新结构、新机理。近年来,新型光电材料如钙钛矿、过渡金属硫化物、超结构材料等在光电领域展现出巨大的应用潜力,并不断刷新各类光电器件的性能指标,但是针对这些新材料物理特性背后的作用机理尚未充分挖掘,尤其是对