论文部分内容阅读
云计算和移动互联网的飞速发展,让互联网步入大数据时代,数据中心得到快速发展。随着数据中心网络规模持续扩大、网络应用不断增加、网络流量愈发复杂,容易在网络中的关键结点处形成流量热点,影响网络应用服务性能和网络平稳运行。做好数据中心网络流量热点方面的分析与研究,能够及时发现网络中的流量热点,通过采取相应措施避免流量热点的再次出现。因此,加强对网络流量热点的分析与研究,具有十分重要的理论和现实意义。本文主要创新点如下:(1)针对数据中心网络规模庞大,流量复杂的实际情况,选取sFlow技术对数据中心网络流量进行采样。通过分析样本数据,根据整个网络中的流量分布,提出一种基于sFlow的网络流量自适应采样方法ASMNT,解决了固定采样速率不能根据当前流量分布调整采样速率的问题。(2)针对在数据中心网络中终端流量容易出现热点的问题,提出了一种基于信息熵的网络流量热点主机分析方法NTHSH-IE。通过计算得到网络中流量的特征分布,利用信息熵方法对这些流量特征分布进行计算,得到流量大小在流量特征上的分布情况,根据这些流量特征分布情况,判断在当前网络中是否出现了热点主机,为分析流量热点主机出现原因和避免终端流量过于聚集给出重要参考。(3)针对数据中心网络中流量负载不均衡导致出现的热点链路问题,提出了一种基于主成分分析的网络流量热点链路的分析方法NTHSL-PCA。通过计算得到网络中的主机之间的流量信息,根据主成分分析方法对这些流量进行降维处理并去除流量之间的相关性,利用主机之间的流量和路由信息得到网络流量在链路上的分布情况,最后结合热点主机的分析结果,判断链路上是否出现了流量热点,对生成负载均衡和流量调度决策,避免单一热点链路,优化网络流量分布给出建议。(4)设计并实现了一个数据中心网络流量热点分析原型系统。在上述工作的基础上首先提出了该原型系统的需求分析和总体设计,进一步详细设计并实现了该原型系统的主要功能模块,实现了数据中心网络流量热点分析和分析结果可视化展示的目标,为网络流量分布的调度和优化提供重要依据。