论文部分内容阅读
k-means聚类算法,是在d维空间Rd里把n个数据对象划分为K个类,其划分原则是计算每个数据对象与K个聚类中心的距离并将其分配到最近的一个类.传统直接k-means算法是随机选取初始中心的,不同的初始中心会产生不同的聚类结果,针对这个不足,提出了一种基于排序划分的聚类初始化方法,该方法简单易于实现,将其应用在真实数据集和模拟数据集上,实验表明在处理非高维数据上这是一种简单而有效的方法,在很大程度上提高了聚类精度和效率.