论文部分内容阅读
当前,网络应用日益普及,伴随而来网络规模不断扩大、网络的复杂性大大增加,使得网络故障管理面临巨大的挑战。传统网络故障管理采用管理者/代理的集中式管理模型。这种网络管理模型下,管理功能主要集中在管理者,代理只是被动地接收管理,没有独立的分析决策能力;网络管理者必须和分散于各地的被管设备上的代理交换数据,这容易在管理者端形成通信瓶颈,增大了网络失效的可能性;而且管理者和代理的行为在定义网络管理协议时就已经固定,网络管理框架缺乏可扩展性、灵活性。 在这种背景之下,很多国内外研究机构提出了思路各异的基于代理技术的分布式网络管理框架。经过分析比较,本文采用多代理技术来实现分布式网络故障管理,旨在克服集中式网络管理模型的不足。由于故障管理是网络管理的重要的组成部分,本文的工作侧重于故障管理方面的研究。 本文设计的网络故障管理框架中,故障管理工作以分布式的方式进行:被管网络被划分为多个区域,各个网络区域内驻留管理代理组,完成本地基本的故障管理工作;当网络故障涉及多个网络区域时,这些区域的管理代理以合作方式完成网络故障定位诊断工作。根据具体的故障管理流程设计管理代理组,包括故障监测代理、定位诊断代理等功能代理,给出各类功能代理的系统结构和功能实现的方法。 故障监测代理不仅负责捕获网络状态信息,而且对采集到的网络原始信息进行预处理。本文应用数据包聚合方法,从庞杂的数据包信息中有效地提炼有价值的信息;还应用动态症状隔离方法,通过动态构造症状过滤器,隔离已监测出的症状,抑制已知症状对后续监测过程的影响,能够更加准确地分离出新的症状,并且扩大监测症状的范围。 本文以分布式系统级诊断算法——ADSD和Hi-ADSD算法——为基础,提出一种分布式故障定位算法:基于两层测试模型的算法,算法指导多个管理代理相互测试以定位故障。该算法采纳Hi-ADSD算法的分层思想,能够将ADSD算法很好的应用于多代理系统,并且引入时间戳机制和不对称信息传递方法改进ADSD算法。然后,通过仿真实验验证了本文提出的算法的可行性和有效性。 对于故障诊断代理的功能设计,本文针对不同类型设备总结了网络设备故障表象和故障类型的映射关系,以知识库的形式表达网络故障特征。当被观测对象满足一定的故障表象时,诊断代理通过查询知识库可以推理得到相应的故障类型。最后给出部分故障诊断程序。