论文部分内容阅读
互联网作为一个典型复杂系统,对其行为进行分析一直是研究的热点问题。近年来,人们广泛开展网络测量,促使网络行为的研究完成了从早期经验假设到客观数据分析的飞跃。然而,网络规模膨胀的加剧以及拓扑结构复杂程度的日渐提高,导致现有网络行为测量分析暴露出越来越多的弊端。面对庞大且复杂的互联网,过于强调局部特性及优化控制的传统研究方法阻碍了人们从宏观上对网络整体行为的把握,同时也阻碍了网络进一步的发展建设。将互联网视为一个相互关联的整体,从大规模范围对网络实施测量,进而揭示互联网在宏观拓扑结构下的整体行为和演化趋势,可以为网络业务和资源的优化与调度、安全防范以及大规模网络的设计提供有参考价值的新思想和新方法,因此必然具有重要的意义。针对网络当前发展需要,本文根据复杂网络理论,充分利用CAIDA提供的海量实测样本数据对网络的传播行为进行分析。网络传播行为在表征互联网在宏观拓扑结构下的整体行为特征方面起着重要作用,为此本文以空间为主线统计了一个测量周期内网络传播的整体行为特征,以时间为主线预测了网络在长时间跨度下传播行为的整体演化趋势,其根本目的是为了揭示互联网在宏观拓扑结构下传播行为特征规律。在明确的研究目标下,本文研究工作主要从样本数据获取、特征度量统计以及演化行为预测三个方面展开。根据工作重点,本文首先从CAIDA Skitter监测点探测到的原始样本中提取适于分析的有效样本数据,借鉴复杂网络中的物理特征量,同时结合互联网自身的传播行为特点,在IP层定义了能够表征网络传播行为的物理特征量——访问时间和访问直径。以所得的有效样本数据分别从整体和局部样本上对访问时间和访问直径进行分析,分析结果表明访问直径和访问时间之间的Pearson相关系数仅为0.346,说明两者之间为低度相关,并且主要表现为相近的访问直径其访问时间相差较大。为解释访问直径对访问时间影响较小的原因,本文针对网络的动态复杂性提出修正算法,从有效样本数据中提取网络链路延迟。对链路延迟样本数据的统计结果表明,超过90%以上的路径其最大的链路延迟消耗了访问时间的1/4以上,说明数据包在网络传播过程中,存在对传播行为有重要影响的链路延迟,并以此定义了IP层上的支配延迟。其次,考虑到支配延迟对网络的传播行为有较大影响,本文进一步研究了支配延迟的行为特征。比较了网络在不同访问时间区间上传播行为,发现访问时间相差较大的路径,其支配延迟对访问时间的比例相近,说明支配延迟对网络传播行为的影响与访问时间本身并没有必然联系,但是由于支配延迟本身在数值上相差较大,导致相近访问直径的路径其传播行为有着较大的差异,并直接表现为访问时间呈现出多峰分布特征。之后,讨论了AS自治域上的支配延迟行为特征。通过将IP级节点映射到AS自治域上,结果表明支配延迟更多地出现在AS自治域内部,并从AS自治域上的传播行为解释了支配延迟较少出现在AS自治域之间的原因。通过将产生支配延迟的IP节点对映射到实际地理位置,对支配延迟产生的主要原因进行了讨论,结果表明链路长度主要影响支配延迟的大小。最后,本文从长时间跨度上描述了网络整体的传播行为演化趋势。首先给出了基于演化的网络访问时间的定义,据此整理了近几年访问时间的样本数据,并论证了演化样本的稳定性。在此基础上,以非线性时间序列分析方法计算了访问时间演化序列的混沌特征量,分析结果表明演化序列具有混沌特征。在此基础上,通过对混沌系统中典型的Logistic模型加以改进,提出了一种基于Logistic模型的、带衰减因子的正余弦函数组合模拟振荡涨落的数学模型,以描述网络延迟的演化态势。根据实际的访问时间演化趋势,以微粒群算法分别从算法收敛性、模型拟合准确度及预测准确度等方面对备选模型参数选优。实验结果表明,最终优选模型在结构选择上比较合理,能够在短期内准确预测网络整体的传播行为。