论文部分内容阅读
遗传算法作为一种智能化的全局搜索算法,是一种解决组合优化的一种有效方法,它是基于自然选择和自然进化的搜索算法。自80年代问世以来便在数值优化、系统控制、结构优化设计等诸多领域的应用中展现出其特有的魅力,同时也暴露出许多不足和缺陷。如完全依赖概率随机地进行操作,虽然可以避免陷入局部极小,但受寻优条件的限制,一般只能得剑全局范围内的近似最优解,很难得到最优解;对参数采用二进制编码,人为地将连续空间离散化,导致了计算精度与字符串长度、运算量之间的矛盾;采用随机优化技术,所以要花费大餐的时间:算法在交叉、变异的进化过程中随机性较强,致使搜索效率低下,具体表现为进化迭代过程中会出现子代最优个体劣于父代最优个体的“退化”现象;遗传算法虽然具有很强的全局搜索能力,但其局部搜索能力较弱(易出现早熟收敛现象)。本论文将遗传算法结合K一均值聚类实现了遗传聚类算法,提出了相应的编码方案和适度函数。实验证明,用遗传聚类算法来求小样本聚类问题,其效率得到了提高。
本文主要工作:
(1)本文在VC++环境下实现基于遗传聚类算法,主要研究的应用于聚类的遗传算法有:基本遗传算法、优化遗传算法。用遗传算法求解聚类问题,首先要解决如何将聚类问题的解编码到基冈串中;如何构造适应度函数来度量每条基因串对聚类问题的适应程度,即如果某条基冈串的编码代表着良好的聚类结果,则其适应度就高,反之,其适应度就低。适应度函数类似于有机体进化过程中环境的作用,适应度高的基冈串在一代又一代的繁殖过程中,产生出较多的后代,而适应度低的基因串则逐渐消亡。如何选择各个遗传操作以及如何确定各操作参数的取值,解决了这些问题后就可以利用通用的GA算法求解聚类问题,这也显示了GA与求解问题无关的强大通用性。本文给出了聚类问题对上述问题的解决方案。
(2)将遗传聚类算法应用到云南个旧锡铜多金属矿床含矿体评价中,探讨地层、岩体的分类和不同断裂类型区分与识别。通过比较儿种算法,验证了算法的有效性,建立最优预测模型,为下一步进行化探异常评价。本文选取了三组数据,根据实际需要整合各数据项得到所要分析的数据,并进行数据预处理。对丁地质变量的数据预处理,程序中首先对数据进行了极差化处理,然后通过遗传聚类算法分析。应用一主要是运用遗传聚类算法对个旧矿区个旧组白泥洞段、马拉格段、卡房段各地层进行分类,然后找出它们的亲疏关系,为下一步对研究区域进行异常评价;应用二是对个旧花岗岩岩体进行分类,找出彼此相关性:应用三是选取个旧矿区14种不同断裂类型,采用遗传聚类算法,找出不同类型间的组合相关性。
通过本文的研究,将基于遗传算法的K均值聚类算法应用于云南个旧找矿评价的尝试,可以看出遗传聚类算法解决了多源、多类型、多属性地质数据处理和分析的问题,在一定程度上突破了传统聚类算法的约束和限制,是一种较为有效的分类方法。为化探异常评价提供了一种新思路和方法。