论文部分内容阅读
优化初始聚类中心选择后可以较好提高K-means算法稳定性、准确率与速度。为此,根据样本空间分布的聚合与分隔特点,考虑所有数据点的密度排序,有较高密度排在前列且与排在其更前位置的点之间的距离较大的数据点是极有可能成为类簇中心的。基于此计算单点局部密度与密度差距离能找到最优初始聚类中心。在UCI数据集和文献[8]数据集上的实验结果表明,该方法可以优化中心选择,且聚类稳定、快速,对噪音具有较强免疫性能。