论文部分内容阅读
基于密度的方法是一种相当有效的聚类方法。能够发现任意形状的聚类.对噪声数据不敏感.但是聚类结果严重依赖于用户参数的合理选择。针对其存在的问题,将最小生成树理论与基于密度的方法相结合.提出了一种基于密度的最小生成树聚粪算法。通过构造、分割最小生成树得到确定样本空间划分的最小生成子树:根据子树特性.产生局部密度参数;并对生成子树进行局部密度聚类。理论分析和应用结果表明。该算法不仅体现了基于密度聚类方法的优点.聚类结果不依赖于用户参数的选择,使数据聚类更合理.特别是对大型数据库非常有效;也体现了数据分区的思想.