论文部分内容阅读
日志对于每个系统来说,都是不可忽视的一部分。现阶段构建的日志分析平台对数据的处理响应时间差较大,实时性不能得到保证,因此提出了基于Storm框架的实时日志密度数据流聚类算法RL-DSCA(Real-time Log density stream clustering algorithm)。该算法综合了经典数据流聚类框架Clustream和一种基于密度的聚类算法DBSCAN实现了多粒度的数据存储。算法可以实现多线程并行的增量更新。设计RL-DSCA算法基于Storm的实现方案,通过ELK进行实时数据采集,选