论文部分内容阅读
IP网络流量特征分析与研究是协议设计、设备开发、网络管理与网络性能提升的基础。现有工作大多集中在固定时间尺度上面,不论是在小尺度情况下,还是在大尺度情况下,都存在一些不足;且现有工作没有考虑到尺度变换的研究角度和方法,鲜有结论给出尺度变换条件下的流量特征分析与研究的结果。本文重点研究多尺度下的IP网络流量特征,主要工作与创新点如下:1)提出了一种多阶段应用层流量在线识别方法总结分析了现有应用层流量识别方法原理与局限性,提出了一种多阶段应用层流量在线识别方法。该方法整合和优化了基于静态端口的识别方法、基于数据包载荷的识别方法和基于统计特征的识别方法,实验表明该方法在带宽为2.5Gbps高速链路下在线应用层流量识别误报率为2%和漏报率为1%。该方法已经应用到自主研发的分布式网络流量测量和控制系统iCare中,某运营商骨干链路实测结果表明,应用该方法后未被识别的应用层流量由先前的多于40%降至了10%以下。2)发现了小尺度下网络流量的Hurst指数叠加效应在小尺度下分析了不同应用流量的自相似特征,主要结论:骨干链路流量Hurst指数普遍接近甚至大于1.0,自相似特征是否依旧存在不确定;HTTP、FTP等传统应用流量仍旧具有明显的自相似特征,由非传统应用构成的其他应用层大类流量的不具有自相似特征;而由各个型应用层大类中典型应用层业务所产生的流量皆具有自相似特征。不同类型的自相似流量序列进行叠加既可能生成自相似流量序列,也可能生成非自相似流量序列。3)实证了大尺度下流量特征的动态性网络在持续地发生变化,人们对网络流量特征的刻画与研究工作亦需持续的进行。为了分析和研究这些变化会对网络流量特征带来什么样的影响或者改变,为了考察当前国内运营商网络中的流量特征与国外相关研究所给出的结果有何异同,本文应用自主开发的分布式流量测量与控制系统iCare对国内网络运营商的城域出口链路上实测流量数据区分出入境方向、区分字节流量和数据包流量,沿链路层、网络层、传输层一直到应用层大类、应用层,从构成、分布和变化趋势等角度全面且详细地对流量特征进行了刻画,并从不同方面考察了流量中的相关性。发现了相当一部分的显著变化和不同,进一步实证了在大尺度下网络流量特征具有因时因地不同和变化的动态性。4)发现了尺度变换下网络流量的Gamma特征采用尺度变换方法分析了不同网络的流量特征,发现以时间间隔与数据包个数间隔作为尺度变换的依据,网络流量在特定尺度范围之上都满足Gamma分布的特征。TCP流量也具有在特定尺度范围之上满足Gamma分布的特征,但UDP流量在任何尺度下面都没有适合的分布对其进行拟合。5)提出了一种基于规则的应用层业务行为回放方法将相关研究成果进行推广加以应用,提出了一种基于规则的应用层业务行为回放方法,该方法定义了默认、隐式-协议、显式-协议、端口-时间和特征-时间等五种基本回放方法规则,可以根据不同的回放方法和关键字等信息构建一个规则库,流生成器和应用生成器依据规则库中的规则链表来执行。实验表明,该方法在提高应用系统的灵活性、可扩展性以及系统的可维护性等具有独特的优势。