论文部分内容阅读
聚类就是按照一定的要求和规律对事物进行区分和分类的过程。在这一过程中没有任何关于类别的先验知识,也没有教师的指导,仅靠事物间的相似性作为类属划分的准则,因此属于无监督分类的范畴。聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支,在模式识别、数据分析、图像分割、特征提取以及市场研究等许多领域已经被广泛地应用。聚类的方法可以分为基于划分的方法、基于分层的方法、基于网格的方法和基于密度的方法。基于密度的方法是一种相当有效的聚类方法,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。而参数设置的细微不同可能导致差别很大的聚类结果。本文提到的三种方法都是基于密度的聚类算法,通过对它们的数值实验表明QC算法在时间复杂度和聚类性能上的表现并不十分突出,在大多数情况下不如PCM算法和Mean Shift算法。