论文部分内容阅读
网络流量分类为区分不同应用业务流量提供了一种有效的技术手段。现有的网络流量分类方法都集中在研究基于单点的识别方法以及如何提高流量分类的识别率。但是随着网络链路的快速发展以及网络带宽的持续增加,网络数据流量也随之快速增长,这导致高速网络链路中待处理数据与传统单节点系统处理能力的矛盾不断增加,严重影响了网络流量分类的性能。因此,研究可行的技术和算法来解决高速网络环境下的流量分类问题是非常必要的。针对高速网络环境下的流量分类问题,提出了一种网络流量分类并行处理模型,并对该模型中的负载均衡算法以及流量分类方法等关键技术进行研究。论文的主要创新工作有: 通过分析高速网络环境下流量分类面临的问题,从提高流量分类速度出发,提出了一种适合高速网络流量分类的并行处理模型。该模型采用并行处理技术,把复杂的分类处理任务调度到后端多个网络流量分类引擎完成。理论分析表明该并行处理模型可扩展性好、可靠性高,可以大大提高系统整体性能,能够很好地适应高速网络环境下的网络流量分类需求。 针对高速网络流量分类并行处理模型中的负载分配问题,提出了一种面向并行网络流量分类的自适应负载均衡算法。该算法基于IP报文头五元组分组方法,使用Hash流表对网络流进行静态预分配,结合自适应动态调整方法对网络流映射进行再调整。模拟实验结果表明,该算法在保证处理节点负载均衡的同时也维持了网络流的一致性,能够确保网络流量分类节点正确分析所接收的报文、统计网络流特征,适合于在高速网络流量分类并行处理系统中的应用。 针对网络流量分类中基于单一分类方法分类精确度低的问题,论文提出了一种基于DPI和机器学习相结合的网络流量分类方法。该方法结合识别精确度高的DPI检测技术和适应性强的机器学习方法,提高了算法的分类精确度和整体适用性。实验证明该方法的分类准确率高于基于DPI的单一分类方法,适合用于识别已知特征、未知特征以及加密的网络流。