论文部分内容阅读
摘要:流数据作为近年来比较重要的一种数据形式,得到了广泛的关注。但由于流数据本身的特点,无法使用传统的算法来对其进行聚类分析。文中在介绍流数据等基本概念的基础上,讨论了流数据聚类的特点,并介绍了目前较为常用的流数据聚类算法。
全文查看链接
该算法能够计算任意时间段内的聚类,也反映了数据流模型的演化,但效率低,对大数据集适应性差。Clustream 算法同样以K-means 算法为基础,因此不能发现任意形状的聚类。
全文查看链接