论文部分内容阅读
在聚簇方法中,k-means算法是最著名和最常用的划分法之一。该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果。但该算法依赖聚类中心的初始分布、距离计算的复杂性大,这些对聚类结果及效率会产生很大的影响。为了降低对初始聚类中心的依赖和算法的时间开支,提出了一种改进算法,该算法汲取了k-medoids轮换法及优化后的采用三角形三边关系定理的k-means算法的优点。实验表明,该改进算法比原k-means算法具有更好的聚类效果及更高的效率。