论文部分内容阅读
聚类方法是一种无监督的学习方法,它在统计决策、数据挖掘等领域中都有广泛的应用.聚类的体系十分庞大,其类别、算法非常多.目前研究者们提出的聚类方法都有其自身的优缺点及其特定的适用数据范围.对相同的数据集,若采用不同的聚类方法,常得到不同的聚类结果.为了人们在实际应用中能更快捷地找到最好的聚类算法以解决其实际问题,本文对聚类方法及代表算法进行了综合分析,并对各种聚类方法的特点进行了评注.
本文对三种著名的聚类算法:k-means算法、COBWEB算法、DENCLUE算法进行了对比分析,为了得到较为客观的对比结果,本文在三种不同的数据集上进行了实验,即有重叠的数据分布,有交叉的数据分布和多类高维UCI数据集,最后对实验结果进行了分析,分析了各种方法在不同数据分布中所得实验结果的原因.