论文部分内容阅读
针对标准的K—均值算法聚类时所面临的初始聚类中心点及聚类个数难以确定的缺点,提出了一种改进的K—均值算法,其核心思想是通过基于密度及散步的方法定位初始中心点,进行初步聚类,判断是否达到预定效果,从而决定是否进行聚合层次聚类,如此迭代执行,从而准确确定聚类个数。实验结果表明改进后的算法在聚类精度、稳定性和时间效率方面,都明显优于标准的K—均值算法。