论文部分内容阅读
不确定数据聚类是数据挖掘领域中的一个重要的研究热点。本文介绍了不确定数据聚类的uk—means算法及其改进算法ck—means。由于ck—means算法必须计算每个簇到所有对象的质心的距离,因此当聚类的样本很大时,聚类效率依然不是很好。本文提出的kd—means算法只需要计算对象到部分质心的距离,因此可以很大程度地提高ck—means算法的效率。该方法是基于kd树索引而提出的改进策略,并用大量的实验来证明改进算法的有效性。