论文部分内容阅读
基于NetFlow的网络流量分类是利用机器学习方法对传统的网络流量识别方法的一种改进和辅助,但这种方式无法真正起到实时网络流管控的作用.原因之一就是因为网络流的捕获和处理在传统的单机模式下很难达到实时处理.而本文采用基于Spark Streaming的方式对网络流进行处理和特征计算.试验证明,这种基于Spark Streaming的网络流分析方法通过高吞吐量的、具备容错机制的实时流数据的处理,具有准实时性的处理特征.