论文部分内容阅读
为了更好地满足用户对各类Internet业务服务质量越来越精细的要求,流量分类是实现有效网络管理的重要环节之一。传统的流量分类方法如基于端口号匹配、特征字段识别的方法,存在准确率低、应用范围受限等问题,已不能很好的满足网络管理的需求,研究新的流量分类方法具有重要的现实意义。本文针对不同的待分类流量样本和不同的应用场合,引入神经网络方法,提出基于神经网络的流量分类方法,研究的主要内容为:引入了检测精度高的有监督的误差反向传播算法(Back-Propagation Algorithm,BP算法)。由于标准BP算法在分类过程中会出现网络收敛速度缓慢,易陷入局部极小值的问题,本文提出了GA-LM网络流量分类方法。该方法采用Levenberg-Marquardt算法(L-M算法)改进BP网络学习方法,并用遗传算法优化网络初始权值和阈值。对已标记的流量数据进行仿真实验,结果表明该方法的网络收敛速度较快,分类性能较高,适合用于流量管理和流量计费中。改进了自组织、自适应性强的无监督的自组织映射(Self -Organizing Mapping,SOM)方法。为了提高无监督聚类算法检测精度,本文提出采用有监督的SOM(Self-SOM,SSOM)进行流量分类,理论和实验证明该方法的分类准确率高于传统的SOM方法,并可根据分类结果方便地分析网络应用类型。但有监督的算法要求训练数据集标记类型,流量样本高度非线性,又引入核的学习思想,提出一种基于核函数的SOM(Kernel-SOM,KSOM)的网络流量分类方法。仿真实验结果表明,该方法的输出映射图性能优于SOM,能识别未知应用类型的流量样本,可以得到较高的分类准确率,适合用于对新的网络应用类型的研究中。基于以上分类算法的分析与改进,本文实现了基于KSOM的网络流量分类模型。该模型具有在线捕获网络数据包,离线形成流量,并采用本文提出的KSOM方法分类的功能。在真实网络环境中经过测试,表明该模型分类性能良好,输出结果直观,易于分析。