论文部分内容阅读
k-means(k均值)算法是聚类方法中常用的一种划分方法。该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果,但该算法有其突出的局限性,少量的孤立点就会对聚类结果产生很大的影响,因此,采用聚类均值点与聚类种子相分离的思想,给出了基于该思想的对k均值算法的改进算法。实验表明,该改进算法比原k均值算法具有更高的准确性。