论文部分内容阅读
勘查地球化学数据分析在地质背景以及找矿勘探研究中起着非常重要的作用,化探异常的解释也一直是勘查地球化学界的研究重点和热点。传统化探数据处理方法常基于数理统计的原理研究单个元素的特征分布圈定出单元素异常,进而根据元素异常的叠加圈定出组合异常。但单元素化探数据一般包含信息有限,不利于反映多元素之间的组合规律以及多元素的空间分布规律,从而不利于分析成岩成矿中元素的共生组合规律。模式识别是综合性的多元特征表达和分析方法,它利用数据本身的内在相关性,并用精确的数学模型进行数据挖掘与信息提取,结合地质上的成岩成矿理论,可以对研究对象的地质作用过程、成矿规律等方面做出更好的分析、解释与预测。模式识别中性能比较好的方法是DENCLUE(DENsitybased CLUst Ering)聚类法,该聚类法的基本思想是根据样品在多变量空间上分布的密度进行聚类并用密度分布函数来表达密度,通过寻找密度分布函数的局部极大值点(称为吸引点)来找到类中心,考察样品点被不同的吸引点所吸引的状况对样品进行归类。该方法具备坚实的数学基础并用简洁而严格的数学模型对高维数据集的任意形状类进行描述,它在对于含有大量噪声的数据处理中具有良好的抗噪性能。本文选择东天山土屋-延东一带为实验区,应用DENCLUE方法进行地球化学勘查数据分析。
本文系统地介绍了DENCLUE算法的原理,对该算法的优异性能与不足进行深入分析;针对DENCLUE算法的缺陷,在参数优化与运行效率两方面对该算法提出改进,力求减小设置距离阀值与密度阀值时的盲目性并提高该算法处理大容量数据集的运行效率,并在VC6.0平台上编程实现DENCLUE算法及其改进算法;最后将DENCLUE及其改进方法应用于东天山地区土屋-延东一带的地球化学勘查中,通过分析研究元素的空间分布以及组合模式,并结合研究区实际地质背景及矿产概况,对该区的成矿带特征、蚀变围岩微量元素、成矿阶段、控矿构造以及地层岩性等方面进行了深入的分析与讨论。
通过研究主要取得以下一些认识:
1、DENCLUE聚类法对参数σ非常敏感。窗宽σ的值直接关系到影响函数,它决定了数域空间中某一个对象的邻域半径从而决定了该对象对其邻居的影响力,进而对全局密度函数的估计造成影响。σ取值过大会导致各个对象的邻域半径太大使得划分出的簇很少,取值过小会造成各个对象的邻域半径太小而划分出太多的簇。σ的取值直接决定了密度吸引子的个数,在σ值过小或过大的范围内吸引子个数保持相对稳定,在其取值的中间区间内吸引子个数变化幅度较大;
2、参数ξ具有两个作用,即确定噪声点以及判断两个中心类之间能否进行合并,其作用就相当于用一个平面去切割所有对象的密度函数值所构成的空间曲面完成最终聚类。若ξ取值过大,则容易丢失低密度聚类,若ξ取值过小,则将多个临近的高密度聚类划到一个任意形状类当中而无法识别出高密度聚集区域;
3、通过密度估计熵的理论实现对参数σ的优选以及通过分析密度函数值的统计分布特征实现对参数ξ的优选,可以得到比较合理有效的聚类结果。参数优选完成后,可以通过试探得到不同的聚类结果,试探规律为:若划为零类的样品过多,则应调大窗宽σ的值减少密度吸引子个数,若类数太少,则应调小窗宽σ的值增加密度吸引子个数,若划为某一类的样品数太多,则可以调高密度阀值ξ从而识别出高密度聚集区,若噪声点太多则将密度阀值ξ适当调小,总的来说,聚类结果对参数σ更加敏感;
4、DENCLUE聚类结果中的第一类是研究区斑岩型铜矿床(点)成矿信息的表达。分析其元素组合及空间分布规律推测:土屋-延东一带与铜矿(化)体有关的地层主要为下泥盆统大南湖组、中泥盆统头苏泉组以及下石炭统企鹅山群,Cu、Cr、Co等元素的聚集以及区内斑岩型铜矿的形成主要与上述地段相关,土屋斑岩型铜矿床一带的地形、气候等多种因素对区内地球化学元素的迁移富集具有重要影响;
5、DENCLUE聚类结果中的第二类是与研究区Cu矿化有关的成矿类,反映出铜的多金属硫化物的矿化作用。该类从微量元素迁移富集的角度对研究区斑岩型铜矿床(点)的蚀变围岩以及主要成矿过程的信息进行了表达;
6、DENCLUE聚类结果中的第三类样品点在所选研究区内沿着康古尔塔格碰撞带分布,并在研究区的西南部依次将西凤山、红西、红石岗、长城山等金矿床覆盖,正是康古尔塔格金矿带构造与成矿关系的微观证明与宏观表现,亦从微量元素的富集迁移规律的角度证明了东天山康古尔塔格金矿带动力热液成矿规律及其各级构造控矿的规律是非常明显的,说明西凤山、红西、红石岗、长城山等金矿床的空间分布、形态与产状、金的矿化富集规律等受到区内断裂构造的控制影响作用;
7、DENCLUE聚类结果中第四类样品点的元素组合及空间分布规律是研究区内地层岩性信息的表达。利用DENCLUE方法能将研究区内的第三、第四系地层与石炭系、泥盆系以及侏罗系地层清晰地区分出来,进一步调整参数识别高密度聚集区,可将第四系上更新统一全新统洪积物与第三系桃树园组区分开来,在第四系的中更新统地层与下更新统地层间亦形成了一条不太明显的界限。