论文部分内容阅读
本文分析了数据聚类算法BIRCH的不足之处,提出了一种基于密度与动态阈值的任意形状聚类挖掘算法——DVTD算法,它结合密度和阈值双重参数,并根据数据集内在特征,动态改变阈值T,既可以控制CF树的大小,也能利用不同球形聚类逼近任意形状的数据聚类。实验结果表明,它的算法复杂度与BIRCH相当,并大大降低了CF的大小,对任意形状的聚类效果可以达到与DBSCAN相近的效果。