基于集成学习思想的矿产资源预测模型研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:kxlzyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矿产资源是国家发展不可或缺的重要资源,随着矿产资源调查的进度不断推进,积累了大量的矿产资源信息数据。利用地物、化、遥进行综合矿产预测变得越发重要。机器学习在综合矿产预测领域中的应用越来越广泛。本次研究通过点格局分析确定32个非矿点位置,与已发现矿点及矿化点合并共计64个样本数据集。利用证据权模型对成矿预测网格进行二态赋值,通过随机森林算法评估研究区内20个控矿因子的重要性,根据评估结果选择10个重要性较强的因子作为模型训练特征。集成随机森林模型、支持向量机模型、逻辑斯蒂回归模型,采用加权多数投票和Subensemble集成两种集成策略,并分别应用于大兴安岭北段额尔古纳地区。通过ROC曲线面积(AUC)、AUC标准差(SAUC)、ROC曲线面积与随机情况下曲线面积0.5的统计差异性(ZAUC)、最大约登指数(MYI)、最大约登指数阈值(OT)、多金属矿产预测存在区占研究区的百分比(PSAO)和多金属矿产预测存在区包含研究区内已发现多金属矿点及矿化点的百分比(PDDC)7个评价指标评估了两种集成成矿预测模型性能,Subensemble集成成矿预测模型性能优于加权多数投票集成成矿预测模型。最后基于最大约登指数划定两级成矿预测远景区,对比分析了两种集成成矿预测模型和其他三种模型的预测远景区的异同并基于Arcpy和scikit-learn的集成开发了成矿预测Python工具集。主要成果和创新如下:(1)基于点格局分析确定和训练集相等数量非矿化点,构建小样本数据集应用于矿产预测,较为合理,有效解决数据不平衡问题。(2)首先基于证据权法进行成矿预测格网二态赋值,其此基于随机森林算法进行控矿因子重要性评估。两者结合发挥各自优势更好的实现控矿因子的优选。(3)本次研究尝试将加权多数投票集成模型与Subensemble集成模型应用于成矿预测中,两者均表现优异表明两种集成学习模型适用于小样本训练集,Subensemble集成优于加权多数投票集成。集成学习模型性能优于单个分类器的性能,Subensemble集成模型充分挖掘训练数据集信息并传递给元分类器,从而模型具有很强的泛化能力。(4)描述了Python机器学习库scikit-learn进行模型预测的一般过程,介绍了scikit-learn API并通过Arcpy集成Arcgis Python工具集。scikit-learn对机器学习过程进行高度抽象和代码重构,为机器学习模型开发提供统一的API,所以了解scikit-learn架构对开发新的机器学习评估器和学习scikit-learn都十分重要。
其他文献
随着中国市场经济的不断发展,对建设工程的管理质量和投资的高回报要求也越来越高,这就要及时提高建设工程的成本控制效果。本文从建设工程成本控制的影响因素出发,简要阐述
采用全矢量有限元方法进行光纤设计优化,得到横截面上失去两层空气洞的双芯光子晶体光纤,可用于液压传感.优化的双芯光子晶体光纤的模场半径和数值孔径与单模光纤基本一致,在优
目的:通过调节慢性肾小球肾炎患者的脂代谢紊乱,观察肾小球肾炎的临床症状及蛋白尿变化情况,探究慢性肾炎的脂代谢紊乱与慢性肾小球肾炎的关系,并分析其产生的机制。资料与方法:本研究严格遵守入选标准,选取了2016年10月至2018年12月在辽宁中医药大学附属医院肾内门诊就诊的符合纳入标准患者进行回顾性分析。纳入基础治疗配合补肾降脂方治疗的患者30例,为治疗组,纳入基础治疗配合黄葵胶囊治疗的患者30例,为
混凝土夹芯板具有良好的保温隔热性能,常用作建筑围护结构,符合建筑工业化的发展战略要求。由于混凝土夹芯外墙板内外叶厚度小,且温差大,引起混凝土内外叶以及内外叶的连接件
在新疆油田稠油开采的过程中,燃煤注气锅炉与双级钠离子软化器都会排放大量的高含盐废水。为了改善新疆周边的生态环境,针对排量大,硬度低的燃煤注汽锅炉排污水,已开展了高含