论文部分内容阅读
数据挖掘是为了满足人们对数据中所蕴涵的信息和知识的充分理解和有效应用而发展起来的一门新兴技术。其中,聚类分析作为数据挖掘的一项主要功能和任务,成为了数据挖掘中的一个重要的研究领域,至今已提出了大量的理论和方法,取得了丰硕的研究成果。尽管如此,聚类分析中还存在许多问题,尤其是随着数据挖掘技术的广泛应用,数据挖掘所面对的数据对象同趋复杂,聚类研究也面临更多新的内容和挑战。这就要求对现有的聚类技术进行改进,同时不断提出新的聚类理论和方法以适应新的应用。
本文对数据挖掘的聚类方法进行了简单的总结,特别对基于人工免疫系统和人工神经网络的AIS和SOM这两类现有的聚类算法进行了深入分析,从而提出了混合这两种基本算法的AISSOM聚类算法。主要内容如下:
第一部分简单介绍了数据挖掘聚类算法的发展以及特点。
第二部分对现有的聚类方法进行了总结,论述了目前主要的聚类算法。
第三部分概述了人工免疫系统的主要内容,和其在数据挖掘中的作用。详细讨论了两种著名的人工免疫系统RLAIS和aiNET,并对它们的特点进行了分析。
第四部分概述了自组织映射的神经网络系统的主要内容,及其在数据挖掘的应用。详细讨论了该系统的特点。
第五部分提出AISSOM这一新的聚类算法,对该该算法流程,和特点进行了分析和讨论。
第六部分实验对比。分别用SOM,AIS和AISSOM这个三种聚类方法在Iris,SCCIT和Breastwn这三个数据集上进行聚类实验,并对结果进行对比。通过四个指标来说明AISSOM的聚类准确性。
最后对现有工作进行总结和展望。