论文部分内容阅读
随着工P网规模的不断增大,网络结构与设备的日益复杂,快速准确地发现并定位网络故障与拥塞,维护网络服务的正常秩序变得越来越困难。传统IP网管系统对故障与性能的管理大多依靠被动的采集与关联性分析,但随着网络技术的飞速发展,被动的管理方式由于其部署成本高,安全性及准确性较差等原因越来越无法满足当前网络环境的需要。因此,基于主动探测的故障与性能管理技术成为近些年来网络管理领域的研究热点,它以其自适应性、高效性和准确性吸引了越来越多研究者的目光。但基于主动探测的管理方式也有其自身的缺陷:第一,向网络中发送的探测会对网络造成一定的负载;第二,通过探测到的数据分析节点或链路的状态需要复杂的计算过程;第三,在一些网络中,单纯地依靠端到端路径探测无法准确得到每一个节点或链路的状态;最后,复杂的网络环境使得噪声不可避免,路由和拓扑的变化、节点状态的变化、探测结果的不准确以及对网络信息了解不完全等都为诊断与推理制造了困难。为了解决了以上问题,本文对基于主动探测的故障诊断与丢包率推理方法进行了深入研究,主要做了以下贡献:(1)提出了一种高效的探测选择算法。新算法可快速地选择出具有近似最大诊断能力的探测集合,从而节省了探测的开销。并且新算法不仅可应用于有噪声的IP网环境中,处理路由不准确以及拓扑的小范围变化等情况,同样也可应用于多故障的IP网环境中。实验证明,相比已有的探测选择算法,新算法在保证探测质量的前提下具有更高的计算效率。(2)提出了适用于复杂网络环境的故障诊断算法。对于有噪声的IP网,本文建立了网络节点与探测的静态贝叶斯模型,模型可将网络噪声表示为描述探测与节点依赖关系的条件概率。在此模型基础上,提出了一种高效的故障诊断算法,新算法首先过滤不准确的探测结果,并限制故障发生个数,在保证了准确度的前提下提高了计算效率。对于动态网络,本文提出一种基于动态贝叶斯模型的故障诊断算法,可处理在诊断过程中网络节点动态变化的情况,填补了动态网络故障诊断的一个空白。(3)提出了可确定链路及链路序列的丢包率推理算法。虽然某些情况下,仅依靠对路径的探测无法推理得到所有链路的丢包率状态,但部分链路的丢包率是可以被唯一确定的。本文提出了一种能快速地找出所有可确定丢包率链路的方法,并将剩余不可确定链路划分为若干链路序列。这些序列满足最小可确定性,即每个序列的整体丢包率是可确定的,而每个序列子集的丢包率是无法确定的。实验证明,相比已有算法,新算法的具有更高的推理效率和更细的诊断粒度。(4)提出了全部网络链路丢包率的推理算法。在去除了所有可确定丢包率的链路后,剩余不可确定链路只能依靠寻找额外系统信息推理得到。本文分别利用非线性规划方法和基于链路之间独立性的方法推理剩余链路丢包率的最有可能解。通过实验与已有的链路丢包率推理算法做了比较,结果证明新算法具有更高的推理准确度和更短的计算时间,并且使用的探测开销仅为已有方法的2%。