论文部分内容阅读
聚类分析是一门重要的技术,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景.目前,人们已经提出了许多聚类算法.其中,DBSCAN是一种性能优越的基于密度的空间聚类算法.利用基于密度的聚类概念,用户只需输入一个参数,DBSCAN算法就能够发现任意形状的类,并可以有效地处理噪声.文章提出了一种加快DBSCAN算法的方法.新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销.实验结果表明,FDBSCAN能够有效地对大规模数据库进行聚类,速度上数倍于