论文部分内容阅读
网络流量特征提取与流量识别技术,是网络运营商实现网络流量监测,进而有效管理网络的重要手段,准确地识别网络流量更是具有重要的意义。然而,随着互联网的飞速发展,网络业务种类多种多样,新兴业务层出不穷,私有协议广泛应用,这些都造成了目前流量特征提取和识别的困难。针对现状,本文对基于确定性特征的P2P流媒体特征提取与流量识别进行了研究,提出了基于一个确定字符串/比特串、基于端口和一个确定字符串/比特串和基于多个确定字符串/比特串这三种识别方法,并使用典型的P2P流媒体业务对所提取特征的有效性进行了验证。另外,本文还研究了基于流量报文净荷关键字的自动协议指纹挖掘技术,并在已有的网络流量分类分析系统中对该技术进行了模块开发和实现,同时对该技术挖掘所得指纹的正确性和有效性就行了验证。此外,本文还对基于属性选择的网络流量分类进行了研究,在分类实验中借用了数据挖掘软件Weka的工作平台,并将实验数据根据所用应用层协议的不同分为UDP数据集和TCP数据集,其中UDP数据集的分类结果令人十分满意,而TCP数据集的分类结果则有进一步提升的空间。总体而言,实现了从训练集中去掉冗余和重复的属性有助于简化对高速网络流量的分类,而不影响分类的正确性。