论文部分内容阅读
矿产资源是我国经济发展的重要支柱力量。目前,矿产资源供需之间的矛盾愈发尖锐,当务之急是实现地质找矿的重大突破,而这需要发展新的地质找矿技术。对矿产勘查实践来说,勘查地球化学方法具有十分重要的作用。故地球化学数据处理,以及与矿化作用有关的地球化学异常识别引起越来越多的关注。近年来,对于地球化学异常识别的研究取得了重要进展。机器学习方法由于其不依赖数据分布、不要求地质变量与预测值之间的线性相关关系、对非线性关系具有强大的刻画能力等优势,被应用于模拟复杂且未知的多元地球化学分布模型,以及提取与矿化作用有关的有意义特征。然而,目前机器学习在地球化学异常识别应用上仍有一些问题没有解决,这些问题牵制了机器学习方法在勘查地球化学领域的应用发展,限制了机器学习的异常识别能力。缺乏考虑地球化学数据空间特性及空间约束是目前机器学习在勘查地球化学领域应用的关键问题。这个问题得不到解决,会使得机器学习的数据处理优势得不到发挥,方法应用停留在表面而不深入,甚至影响到对找矿信息二次挖掘和利用。机器学习方法在地球化学异常识别的应用中,主要分为利用已知矿点作为标签数据的有监督异常识别以及无标签数据的无监督异常识别。由于有监督的学习方式缺乏考虑数据的内在结构,遗漏潜在的成矿信息,故本研究主要探讨无监督机器学习在地球化学异常识别应用中,自编码神经网络是无监督机器学习方法中最为重要的方法,如何融入地球化学数据的空间信息以提高自编码神经网络的地球化学异常识别能力。需要强调的是该研究主题与本专业测绘科学与技术具有一定的关联性,这是因为我们将地球化学空间分布图看作是地理景观数据,以测绘科学与技术中的地理信息数据分析及处理方法来解决地球化学异常识别的问题,从而将测绘科学技术与地球化学专业结合起来。本论文主要从两个方面着手研究顾及空间约束的无监督异常识别自编码神经网络方法,一是利用多元素之间的关系作为重构成份完成背景重构,另外一种是利用元素的空间信息作为重构成份完成背景重构。这两者皆是以大概率样本作为成分重构背景,从而达到背景与异常分离的效果。具体研究工作如下:(1)多元关系重构方法的主要问题是忽略了地球化学背景的空间异质性,导致对有价值的地球化学异常的识别无效。本文提出了一种多元地球化学异常识别的空间约束多自动编码器(Spatially Constrained Multi-Autoencoder Approach,SCMA)方法。该方法利用“因地制宜”思想去化解空间异质性带来的异常识别困难。其考虑了地球化学样本的化学相似性和空间连续性,通过多元聚类、空间滤波和空间融合等方法对不同背景的空间进行划分。利用多自编码器结构对每个子域的地球化学背景进行学习和重构,以减少自编码器神经网络中权值随机初始化的影响。然后计算异常分值作为观测到的地球化学特征与重建特征的差值。(2)地球化学背景的空间结构特征往往被忽略,如何有效提取元素的空间结构信息是关键问题。本文提出了一种多卷积自编码器(Multi-convolutional Autoencoder Approach,MCAE)方法来处理多元地球化学异常识别,该方法包括三个独特的步骤:(1)消除地球化学元素之间的相关性,避免有效背景信息被冗余数据稀释;(2)利用Global Moran’s I指数来明确元素背景空间结构的识别域,以保证模型有效提取元素背景空间结构信息;(3)利用多卷积自编码器非交互方式学习和重构背景空间结构特征,避免了学习过程中多元素相互干扰。最后根据观测地球化学数据与重建数据的差异计算异常值。(3)本文提出的方法皆应用于中国福建闽西南铁多金属成矿区,采用1:20万水系沉积物样品中Cu、Mn、Pb、Zn、Fe2O3元素对研究区进行多元异常识别。结果表明,SCMA和MCAE模型都在各方面都优于现有的几种方法,其识别的异常与该地区已知Fe矿床空间相关性较高,异常识别准确性得到有效提高。在具体工作之中,本文的创新点有两个:(1)揭示了准确划分空间域的关键因素,提出了基于空间约束多自编码器的多元地球化学识别方法。以往的自编码神经网络应用在地球化学异常识别上往往忽略了地球化学背景的空间异质性,导致对有价值的地球化学异常的识别无效。我们提出的基于空间约束多自编码器的多元异常识别方法,考虑到地球化学样品的化学相似性和空间连续性,创新性的提出了空间异质区域划分方式,其通过多变量聚类、空间滤波和空间融合,将区域划分为多个不相交子域,在空间上区分不同模式的地球化学背景。这样的空间划分方法可以较大提高地球化学背景重建和异常识别的质量。(2)揭示了确定背景识别域的关键因素,提出了基于多卷积自编码的多元地球化学异常识别方法。以往的自编码神经网络应用在地球化学异常识别上,没有考虑过空间结构作为背景重构成分来重构元素地球化学背景。我们提出的基于多卷积自编码神经网络的多元地球化学异常识别办法,其利用元素空间相似性指数来确定背景识别域,并以此设定移动卷积窗口尺寸,其避免了尺度设置不正确带来的结构提取不准确的问题。同时,在该方法中,利用ZCA白化算法来消除多元素之间携带的冗余信息,降低了多元背景融合难度。这些措施较大程度地提高了地球化学背景空间结构提取的能力,达到了提升多元异常识别的准确性的目的。总之,本文贡献是提出了一种灵活的、顾及空间信息的地球化学异常识别自编码神经网络框架,其包括的两种顾及空间约束的自编码神经网络方法。本文主要探讨了适合于自编码神经网络学习的空间域划分影响因素,以及确定地球化学元素背景识别域的关键因素。本研究工作不仅丰富了自编码神经网络方法在地球化学异常识别应用上的认识,同时为其他领域空间数据自编码神经网络应用提供了新的思路和方法。