论文部分内容阅读
为了在不了解原始数据内部结构的情况下,确定合适的聚类数,本文提出了一种聚类结果稳定性的衡量方式,结合传统的手肘法来确定聚类数。实验采用了UCI上3个标准的机器学习聚类数据集,在wine数据集上,该方法和手肘法均能找到正确的分类数。在iris和digits数据集上,手肘法未能确定聚类数,本文方法给出了几个可能的聚类数(包含最优聚类数)。