论文部分内容阅读
对数据聚类的研究有很长的历史,几十年来,其重要性以及与其他研究方向的交叉特性得到人们的肯定。然而,细胞自动机在数据聚类方面的研究却相对较少。本文研究了细胞自动机与蚁群算法结合用于数据聚类的算法,并通过引入细胞簇的概念,研究其对原算法的改进。首先研究了一种一维细胞自动机聚类算法,通过对算法中细胞自动机边界条件和邻居半径的讨论,对该算法中的转换规则进行细化与改进,加快了算法的收敛过程。其次研究算法中聚类簇分界点的判定问题,指出原算法存在聚类簇边界点难以判定的不足,并通过引入细胞簇的概念对原算法进行改进,从而解决一维细胞自动机上聚类簇分界点的判定问题。通过对聚类结果的进一步观察,将细胞簇进行合并,在保证聚类正确率的前提下减少聚类簇个数。通过人工数据集和UCI数据集上的实验,研究了算法不同参数取值对聚类结果的影响,并给出了不同数据集上的聚类结果。同时将改进算法应用于雷达辐射源识别。通过对同一类别不同型号雷达数据以及不同类别不同型号雷达数据的聚类,进一步验证了算法的有效性,并显示算法参数的调节对聚类相似性尺度的影响。随后,将细胞簇概念应用于二维细胞自动机聚类算法,即人工蚂蚁休眠模型(ASM),给出二维细胞自动机上聚类簇的计算公式、移动策略及具体实现方法。实验结果表明,通过将细胞簇引入ASM算法,改进了ASM算法对聚类簇标签的判定问题,减少了算法的迭代次数。同时,根据实验结果,我们指出适当减小网格大小可以进一步加快算法的收敛。