论文部分内容阅读
如今,隐伏矿产逐渐成为勘查重点,但由于其埋藏较深,只能通过各种地物化遥的数据间接预测找矿靶区,针对这种多维数据,究竟哪些属性和隐伏矿产联系密切,哪些没有联系,粗糙集的理论方法就在剔除冗余属性信息方面具有很好的筛选能力。对已知的一些隐伏矿产各属性特征通过机器学习建立分类模型,然后预测新的找矿靶区,如今已成为一个非常热门的研究方向。基于VC维和结构风险最小化的统计学习理论的支持向量机分类模型,具有很强的理论基础和分类能力,其能很好地解决小样本、非线性、过学习、维数灾难和局部极小等问题。结合粗糙集对多维数据约简降维的预处理功能,能够达到很好的分类效果和泛化能力,使得找矿靶区的预测更加准确。本文展开了如下工作:1)在云南个旧锡铜矿试验区内,基于ArcGIS对物探、化探数据用反距离插值的方法生成栅格数据,并在试验区随机提取500个随机样本点和锡铜矿矿区提取100随机样本点,用栅格数据提取至点的方法赋予其物探、化探条件属性值,在锡矿一定范围内设置一个buffer缓冲区,给缓冲区内外的样本点赋予不同的决策属性值,构建一个完整的决策属性系统。2)基于条件属性取值的连续性,在MATLAB编程实现时,主要采取邻域粗糙集的方法,设置一个合适的邻域半径,对训练样本进行离差标准化处理,对41个物化探条件属性进行属性约简,尝试通过构建模糊因子的方法优化约简算法,用基于属性重要性的方法对每一个约简的属性赋予权重,并尝试基于挑选属性的先后顺序赋予属性相应的权重。编写KNN算法排除奇异点时,设计合适的参数,并结合ArcGIS地统计分析的概率直方图、半变异协方差云分析等综合剔除噪声数据,并挑选边界域的训练样本点作为最终的SVM模型训练样本集,完成邻域粗糙集的预处理工作。3)在MATLAB中,选取高斯核函数对训练样本构建SVM模型,通过十折交叉验证的检验方法优化模型参数,得到最优分类模型,最后遍历整个个旧锡矿试验区,对整个区域做锡矿矿产资源评价分析,并通过改变邻域半径对比不同的属性约简和模型预测评价系统。