论文部分内容阅读
摘 要:本文用针对不同类型设备的分类构造方法得到网络故障模型,总结了网络设备类型故障表象和故障类型的映射关系。本文以知识库的形式表达各种网络模型,当被观测对象满足一定的表象现象时,可以推理得到相应的故障类型。
关键词:网络故障管理 故障诊断
中图分类号:TP393 文献标识码:A 文章编号:1674-098X(2012)04(b)-0037-01
计算机技术和网络技术不断发展,网络的应用越来越普及,使得网络规模更大,网络更加复杂。因此,网络故障管理面临巨大的挑战。传统的集中式网络管理模型不能适应当前分布式、动态性的网络环境。本文采用分布式网络管理模型,提出基于多代理技术的网络故障管理框架,并且针对网络故障管理各个阶段详述了分布式网络故障管理的具体实现方法。
1 网络故障现象与MIB变量的关系
管理信息库(MIB)提供了网络管理数据的标准,为网络故障管理提供了丰富的网络状态信息。在这个标准里规定了网络设备必须保存的数据项目、数据类型,以及允许在每个数据项目中的操作。通过对这些数据项目的存取访问,就可以得到该设备的统计数据。MIB II定义了11组MIB变量,在这些MIB变量组定义的变量中,定义了很
多与故障管理有关的变量。例如,IF组中可用于故障管理的MIB对象有:接口丢弃的输入包数(iflnDiscards)、接口丢弃的输出包数(ifOutDiscards)、包含错误的输入包数(iflnErrors)、包含错误的输出包数(ifOutErrors)、接口接收的字节数(必Octets)、接口发送的字节数(ifDutOctets),输入的单播包数(ifinUNcatPkts)、输出的单播包数(ifOutUcastPkts)、输入的非单播包数(iflnNUcastPkts)、输出的非单播包数(ift7utNUcastPkts)、因定向到一个未知或不支持的协议而被丢弃的包数(IfInUnknownProtos),输出队列中的所有包数(IfOutQlen)。其它组中也有与故障管理有关的对象属性,例如IP组中:收到的全部IP分组数(ipInReceives)、收到的全部IP分组中成功发送到IP的上层协议的个数(iplnDelivers),IP的上层协议提供给IP传送的全部IP分组数(ipOutRequests)等;UDP组中:接收到的UDP数据报总数(udpInDatagrams),发送的UDP数据报总数(udpOutDatagrams)等;TCP组中:接收到的TCP段总数(tcplnSegs)、发送的 TCP段总数(tcpOutSegs)等等。
因为MIB变量并不是为了网络故障诊断而设计的,所以许多网络故障表现与MIB变量之间不存在一一对应关系,即无法通过某个MIB变量直接判断是否存在网络故障。但是利用多个MIB变量的组合式能指示网络的当前状态,可以有效地表示网络故障特征.如利用查询得到的MIB对象的组合得到如网络吞吐率、负载率、传输时延等有关网络参数。
2 路由器设备的故障诊断
参照路由器故障的层次划分,我们将路由器中可能出现的各种网络故障汇集在一起,组成一颗描述路由器故障的故障树。以下的模型中仅以Cisco公司2600系列路由器为例,列出了它们的MIB变量标识符,事实上,对于不同厂家的路由器,只需要找到功能相同的MIB变量,就可以同样依照上述模型进行故障诊断。
2.1 绝对连接不通
故障1:以太网端口硬件坏、线路断或对方设备故障。
表现现象:端口状态down,链路协议状态down o
对应MIB:1.3.6.1.2.1.2.2.1.8.x(端口号片(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口号) (down)
故障2:以太网端口被管理性关闭。
表现现象:端口状态down,链路协议状态down,端口管理状态downs。
对应MIB:1.3.6.1.2.1.2.2.1.8.×(端口号)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口号=0(down)
1.3.6:1.2.1.2.2.7.×(端口号)=2(down)
2.2 串行接口
故障1:串口的模式设置不对,一般串口应设定为SCTE模式。
表现现象:串口状态即,线路协议状态down,串口的DSU不是SCTE模式。
对应MIB:1.3.6.1.2.1.2.2.1.8.×(端口号)=1(up)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口号)=0(down)
故障2:串口数据链路协议错(与原来的设置不相符)。
表现现象:串口状态down,线路协议状态down,链路协议与原来的设定值不一致。
对应MIB:1.3.6.1.2.1.2.2.1.8.x(端口号)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口号)=0(down)
3 三层交换机设备故障诊断
3.1 绝对连接不通
故障1:交換机的连接端口(下连)硬件坏、线路断或对方设备故障:
表现现象:端口状态down,链路协议状态down o
对应MIB:1.3.6.1.2.1.2.2.1.8.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
故障2:交换机的连接端口被管理性关闭
表现现象:端口状态down,链路协议状态down,端口管理状态down o
对应MIB: 1.3.6.1:?.1.2.2.1.8.x=2(down)
1.3.6.1.2.1.2.2.1.7.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
3.2 相对连接不通
MAC地址冲突。
表现现象:三层交换机中某个端口的固化表中有网络工作站IPI或IP2所对应的MAC1或MAC2的地址。如果在连接线路上经过了路由器,而固化了该MAC地址的交换机端口不能到达路由器,则要加入对路由器对应的以太网端口的MAC地址的判断。
对应MIB:1.3.6. I .4.1.43.29.4.10.2.1.19(a3ComSysBridgeAddressLearnMode)
1.3.6.1.4.1.43.29.4.I O.S.1.5(a3ComSysBridgePortAddressIsStatic)
{isStatic(1),isDynamic(2)}
3.3 连接性能故障
故障1:线路噪音:由于线缆类型不对、接口卡坏、干扰信号等.
表现现象:端口的CRC错误增多,冲突数不增多。
对应MIB:1.3.6.1.2.1.16.1.1.1.8(etherStatsCRCAIignErrors)
1.3.6.1.2.1.16.1.1.1.13(etherStatsCollisions)
故障2:后冲突;由于线缆过长或中继过多.
表现现象:端口的后冲突数增加。
对应MIB:1.3.6.1.2.1.10.7.2.1.8(dot3StatsLateCollisions)
在网络故障定位之后,网络故障的处理范围己经缩小到故障点,接下来的工作就是要根据故障点的表现现象判定网络故障类型和产生故障的原因。本文用针对不同类型设备的分类构造方法得到网络故障模型,总结了网络设备类型故障表象和故障类型的映射关系。本文以知识库的形式表达各种网络模型,当被观测对象满足一定的表现现象时,可以推理得到相应的故障类型。
关键词:网络故障管理 故障诊断
中图分类号:TP393 文献标识码:A 文章编号:1674-098X(2012)04(b)-0037-01
计算机技术和网络技术不断发展,网络的应用越来越普及,使得网络规模更大,网络更加复杂。因此,网络故障管理面临巨大的挑战。传统的集中式网络管理模型不能适应当前分布式、动态性的网络环境。本文采用分布式网络管理模型,提出基于多代理技术的网络故障管理框架,并且针对网络故障管理各个阶段详述了分布式网络故障管理的具体实现方法。
1 网络故障现象与MIB变量的关系
管理信息库(MIB)提供了网络管理数据的标准,为网络故障管理提供了丰富的网络状态信息。在这个标准里规定了网络设备必须保存的数据项目、数据类型,以及允许在每个数据项目中的操作。通过对这些数据项目的存取访问,就可以得到该设备的统计数据。MIB II定义了11组MIB变量,在这些MIB变量组定义的变量中,定义了很
多与故障管理有关的变量。例如,IF组中可用于故障管理的MIB对象有:接口丢弃的输入包数(iflnDiscards)、接口丢弃的输出包数(ifOutDiscards)、包含错误的输入包数(iflnErrors)、包含错误的输出包数(ifOutErrors)、接口接收的字节数(必Octets)、接口发送的字节数(ifDutOctets),输入的单播包数(ifinUNcatPkts)、输出的单播包数(ifOutUcastPkts)、输入的非单播包数(iflnNUcastPkts)、输出的非单播包数(ift7utNUcastPkts)、因定向到一个未知或不支持的协议而被丢弃的包数(IfInUnknownProtos),输出队列中的所有包数(IfOutQlen)。其它组中也有与故障管理有关的对象属性,例如IP组中:收到的全部IP分组数(ipInReceives)、收到的全部IP分组中成功发送到IP的上层协议的个数(iplnDelivers),IP的上层协议提供给IP传送的全部IP分组数(ipOutRequests)等;UDP组中:接收到的UDP数据报总数(udpInDatagrams),发送的UDP数据报总数(udpOutDatagrams)等;TCP组中:接收到的TCP段总数(tcplnSegs)、发送的 TCP段总数(tcpOutSegs)等等。
因为MIB变量并不是为了网络故障诊断而设计的,所以许多网络故障表现与MIB变量之间不存在一一对应关系,即无法通过某个MIB变量直接判断是否存在网络故障。但是利用多个MIB变量的组合式能指示网络的当前状态,可以有效地表示网络故障特征.如利用查询得到的MIB对象的组合得到如网络吞吐率、负载率、传输时延等有关网络参数。
2 路由器设备的故障诊断
参照路由器故障的层次划分,我们将路由器中可能出现的各种网络故障汇集在一起,组成一颗描述路由器故障的故障树。以下的模型中仅以Cisco公司2600系列路由器为例,列出了它们的MIB变量标识符,事实上,对于不同厂家的路由器,只需要找到功能相同的MIB变量,就可以同样依照上述模型进行故障诊断。
2.1 绝对连接不通
故障1:以太网端口硬件坏、线路断或对方设备故障。
表现现象:端口状态down,链路协议状态down o
对应MIB:1.3.6.1.2.1.2.2.1.8.x(端口号片(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口号) (down)
故障2:以太网端口被管理性关闭。
表现现象:端口状态down,链路协议状态down,端口管理状态downs。
对应MIB:1.3.6.1.2.1.2.2.1.8.×(端口号)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口号=0(down)
1.3.6:1.2.1.2.2.7.×(端口号)=2(down)
2.2 串行接口
故障1:串口的模式设置不对,一般串口应设定为SCTE模式。
表现现象:串口状态即,线路协议状态down,串口的DSU不是SCTE模式。
对应MIB:1.3.6.1.2.1.2.2.1.8.×(端口号)=1(up)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口号)=0(down)
故障2:串口数据链路协议错(与原来的设置不相符)。
表现现象:串口状态down,线路协议状态down,链路协议与原来的设定值不一致。
对应MIB:1.3.6.1.2.1.2.2.1.8.x(端口号)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口号)=0(down)
3 三层交换机设备故障诊断
3.1 绝对连接不通
故障1:交換机的连接端口(下连)硬件坏、线路断或对方设备故障:
表现现象:端口状态down,链路协议状态down o
对应MIB:1.3.6.1.2.1.2.2.1.8.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
故障2:交换机的连接端口被管理性关闭
表现现象:端口状态down,链路协议状态down,端口管理状态down o
对应MIB: 1.3.6.1:?.1.2.2.1.8.x=2(down)
1.3.6.1.2.1.2.2.1.7.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
3.2 相对连接不通
MAC地址冲突。
表现现象:三层交换机中某个端口的固化表中有网络工作站IPI或IP2所对应的MAC1或MAC2的地址。如果在连接线路上经过了路由器,而固化了该MAC地址的交换机端口不能到达路由器,则要加入对路由器对应的以太网端口的MAC地址的判断。
对应MIB:1.3.6. I .4.1.43.29.4.10.2.1.19(a3ComSysBridgeAddressLearnMode)
1.3.6.1.4.1.43.29.4.I O.S.1.5(a3ComSysBridgePortAddressIsStatic)
{isStatic(1),isDynamic(2)}
3.3 连接性能故障
故障1:线路噪音:由于线缆类型不对、接口卡坏、干扰信号等.
表现现象:端口的CRC错误增多,冲突数不增多。
对应MIB:1.3.6.1.2.1.16.1.1.1.8(etherStatsCRCAIignErrors)
1.3.6.1.2.1.16.1.1.1.13(etherStatsCollisions)
故障2:后冲突;由于线缆过长或中继过多.
表现现象:端口的后冲突数增加。
对应MIB:1.3.6.1.2.1.10.7.2.1.8(dot3StatsLateCollisions)
在网络故障定位之后,网络故障的处理范围己经缩小到故障点,接下来的工作就是要根据故障点的表现现象判定网络故障类型和产生故障的原因。本文用针对不同类型设备的分类构造方法得到网络故障模型,总结了网络设备类型故障表象和故障类型的映射关系。本文以知识库的形式表达各种网络模型,当被观测对象满足一定的表现现象时,可以推理得到相应的故障类型。