论文部分内容阅读
针对大数据环境下高维数据聚类速度慢、准确率低的问题,提出了一种面向大数据的快速自动聚类算法(FACABD)。FACABD聚类算法利用谱聚类算法对大数据集进行归一化和列降维,提出了一种新的快速区域进化的粒子群算法(FRE-PSO),并利用该算法进行行降维;然后在行列降维的基础上,引入聚类模糊隶属度基数,自动发现簇的数目,根据类簇数目,采用FRE-PSO算法结合模糊聚类算法,实现了快速自动聚类。在多个不同数据集上的实验结果表明,该算法能够在数据驱动下快速自动聚类,与其他聚类算法相比,有效地提高了运行速度