论文部分内容阅读
针对不确定数据流上的聚类问题提出了一种新的聚类算法SWCUS,它采用滑动窗口缓存一段时间内的元组作为聚类对象,只存储新到达的数据,“淘汰”过时数据,以便获得高质量的聚类结果。另外它还应用k—means算法来生成初始微簇并且提出了一种新的离群点机制来排除离群点。实验结果表明,SWCUS算法与同类型的算法相比有较好的聚类效果和较快的聚类速度,而且其自身拥有很强的可伸缩性。