论文部分内容阅读
网络管理员基本都明白,当广播数据充斥网络不能被及时处理时,它会消耗大量带宽资源,严重时能使整个网络发生瘫痪,从而使网络不能正常连接,也不能正常访问Internet。当局域网发生广播风暴现象时,该如何快速查找定位广播风暴源头,让网络恢复稳定运行呢?现在,本文就使用不起眼的拔线法,来有效解决一则十分蹊跷的广播风暴故障。
故障现象
某单位局域网中大约有三百台计算机,分布在A、B、C三座大楼上,其中B楼为主楼,网络中心就位于该楼的六楼上,A楼、C楼中的计算机全部使用光纤转换器,与网络中心机房中的核心路由交换机连接在一起,所有计算机的上网参数都是从局域网DHCP服务器那里动态获得的。几年前单位刚刚建网时,由于各方面的原因,并没有拿出合理的建设方案或规划,所有的计算机都连接在相同工作网段中,这就给日后的网络稳定运行带来了很大的麻烦,但幸运的是单位网络自组建成功起,始终没有发生过大面积无法上网问题。
最近,不幸的事情终于发生了,大楼内的所有计算机都无法上网了。故障发生的时候,单位网管员火速赶到A楼现场,任意选择了一台计算机进行ping测试,发现局域网网关地址无法ping通,但是普通计算机相互之间能够正常ping通,这样每台计算机自然就不能正常通过网关访问Internet网络了。不过,让人觉得十分蹊跷的是,B楼中网络中心的所有计算机上网都很正常,上网速度也很流畅。由于中心的所有计算机是通过配线架,与单位局域网的核心路由交换机直接连接在一起的,网管员认为这种现象十分奇怪,但经过初步排查分析,认为这种现象多半是广播风暴引起的。
更让人感到莫名其妙的是,有一个房间由于上网接口数量不够,使用了D-Link宽带路由器进行扩展,与宽带路由器相连的所有计算机都不能上网。但将宽带路由器从局域网中断开,用一台笔记本电脑与连接路由的网线相连,看到笔记本电脑竟然可以上网,再次将宽带路由器接入后,宽带路由器上的几台计算机居然都能正常上网了。如果上面的现象是广播风暴引起的,按理来说,局域网中的所有计算机上网都会受到影响;要是这种现象与病毒攻击有关,那就更不应该出现几台计算机重新连接就能上网的奇怪现象了,一时网管员陷入了毫无头绪之中。
故障解决
网管员分析病毒攻击造成影响的可能性不大,因为用笔记本替换宽带路由器后,笔记本上网恢复了正常,几台计算机重新连接时也都能正常上网了,问题还应该是局域网中存在广播风暴现象,但是广播风暴的源头在哪里呢?大家知道,网络广播风暴产生的原因,主要有下面几种:
一是网卡设备存在硬件故障:倘若计算机中的网卡设备发生硬件损坏,就会引发广播风暴现象。因为硬件损坏的网卡设备,会反复向交换机发送大量的广播数据包,这些无效的数据包得不到及时处理,就会引发广播风暴现象。由网卡设备物理损坏造成的广播风暴,排查起来比较困难,毕竟损坏的网卡有时还能工作,往往借用Sniffer之类的管理工具,分析端口数据流量,来快速定位故障点位置。
二是网络设备自身问题:很多人总认为交换机是点对点转发,不会引发广播风暴现象。但在实际购买交换机时,一些智能型的集线器,常常会被奸商当做交换机来卖。如果这样,在上网高峰期的时候,肯定会出现广播风暴现象。
三是网络病毒攻击:现在各种类型的网络病毒层出不穷,一旦网络中有计算机中毒后,会立即通过网络进行恶意传播、扩散。网络病毒的反复传播,就会消耗大量的带宽资源,造成网络堵塞,引起广播风暴。
四是网络环路:在规模较大的网络环境中,很容易出现一条双绞线同时插在一台交换机的不同端口上,这会造成网络传输性能急骤下降,访问网页都十分困难。这种问题,就是明显的网络环路现象。网络环路现象的产生,往往都是因为一条物理线缆的两端,同时接入到了交换机或路由器设备中。
五是黑客工具正在工作:一些恶意用户,可能会偷偷使用黑客软件,对局域网的稳定运行进行悄悄攻击,由于这些工具的持续工作,网络也容易产生广播风暴现象。
无论是哪种原因引起的广播风暴,对于管理经验丰富的网管员来说,他们往往会使用Sniffer之类的局域网管理软件,通过观察分析交换端口流量等方法,来寻找网络中的广播风暴源头,不过对于经验不多的网管员来说,使用上述方法显然有点勉为其难。为了快速定位广播风暴源头,单位网管员首先将故障现象报告给了本地宽带服务提供商,请他们前来测试宽带光纤线路连通性,经过专业技术人员的反复测试,确认A楼、C楼的光纤线路通过转换器,可以顺畅地连接到网络中心的核心路由交换机,专业技术人员认为问题还是出在局域网内部,必须自行解决。
不得已,单位网管员采用了最简单的办法,他断开连接A、B、C楼的网络连接,仅将来自网络中心的交换机连接保留了下来,然后在中心机房的某台计算机中使用ping命令,不停测试局域网网关地址的连通性,要是能够正常ping通(如图1所示),同时没有明显数据丢包现象时,那就意味着广播风暴位置肯定位于网络中心之外的计算机中。接着,依次将A、B、C楼的网络连接重新接上,同时观察ping命令测试结果,如果某一座楼的连接恢复接入时ping命令测试失败,或数据丢包现象非常严重,基本就能断定是对应大楼内计算机的问题。
按照同样的操作方法,到特定大楼交换机现场,先拔下所有连接线缆,之后继续采用边进行ping测试,边依次插入网络线缆的方法,直至出现无法Ping通为止,引起ping测试操作失败的那个上网节点,就是局域网广播风暴的源头。再依照组网资料,准确定位到引起广播风暴现象的计算机或网络设备上,将其从局域网中断开,使用查杀病毒或更换设备的方法,消除广播风暴现象即可。
最后总结
上面的故障排查方法,对于不熟悉组网结构,或经验不丰富的网管员来说,非常简单实用。日后,大家再遇到广播风暴之类的网络故障时,不妨使用相同的方法来解决:首先请人或使用专业工具测试线路,排除物理连接问题;其次检查重要网络设备工作状态,确认交换机之类的硬件设备是否有问题;第三断开所有上网连接,通过边ping边插线方法,快速定位影响网络不通的故障节点,再采取针对性措施进行恢复。而无数的故障排查经验也告诉我们,拔线法在解决网络故障时,是最简单且容易掌握的方法。
故障现象
某单位局域网中大约有三百台计算机,分布在A、B、C三座大楼上,其中B楼为主楼,网络中心就位于该楼的六楼上,A楼、C楼中的计算机全部使用光纤转换器,与网络中心机房中的核心路由交换机连接在一起,所有计算机的上网参数都是从局域网DHCP服务器那里动态获得的。几年前单位刚刚建网时,由于各方面的原因,并没有拿出合理的建设方案或规划,所有的计算机都连接在相同工作网段中,这就给日后的网络稳定运行带来了很大的麻烦,但幸运的是单位网络自组建成功起,始终没有发生过大面积无法上网问题。
最近,不幸的事情终于发生了,大楼内的所有计算机都无法上网了。故障发生的时候,单位网管员火速赶到A楼现场,任意选择了一台计算机进行ping测试,发现局域网网关地址无法ping通,但是普通计算机相互之间能够正常ping通,这样每台计算机自然就不能正常通过网关访问Internet网络了。不过,让人觉得十分蹊跷的是,B楼中网络中心的所有计算机上网都很正常,上网速度也很流畅。由于中心的所有计算机是通过配线架,与单位局域网的核心路由交换机直接连接在一起的,网管员认为这种现象十分奇怪,但经过初步排查分析,认为这种现象多半是广播风暴引起的。
更让人感到莫名其妙的是,有一个房间由于上网接口数量不够,使用了D-Link宽带路由器进行扩展,与宽带路由器相连的所有计算机都不能上网。但将宽带路由器从局域网中断开,用一台笔记本电脑与连接路由的网线相连,看到笔记本电脑竟然可以上网,再次将宽带路由器接入后,宽带路由器上的几台计算机居然都能正常上网了。如果上面的现象是广播风暴引起的,按理来说,局域网中的所有计算机上网都会受到影响;要是这种现象与病毒攻击有关,那就更不应该出现几台计算机重新连接就能上网的奇怪现象了,一时网管员陷入了毫无头绪之中。
故障解决
网管员分析病毒攻击造成影响的可能性不大,因为用笔记本替换宽带路由器后,笔记本上网恢复了正常,几台计算机重新连接时也都能正常上网了,问题还应该是局域网中存在广播风暴现象,但是广播风暴的源头在哪里呢?大家知道,网络广播风暴产生的原因,主要有下面几种:
一是网卡设备存在硬件故障:倘若计算机中的网卡设备发生硬件损坏,就会引发广播风暴现象。因为硬件损坏的网卡设备,会反复向交换机发送大量的广播数据包,这些无效的数据包得不到及时处理,就会引发广播风暴现象。由网卡设备物理损坏造成的广播风暴,排查起来比较困难,毕竟损坏的网卡有时还能工作,往往借用Sniffer之类的管理工具,分析端口数据流量,来快速定位故障点位置。
二是网络设备自身问题:很多人总认为交换机是点对点转发,不会引发广播风暴现象。但在实际购买交换机时,一些智能型的集线器,常常会被奸商当做交换机来卖。如果这样,在上网高峰期的时候,肯定会出现广播风暴现象。
三是网络病毒攻击:现在各种类型的网络病毒层出不穷,一旦网络中有计算机中毒后,会立即通过网络进行恶意传播、扩散。网络病毒的反复传播,就会消耗大量的带宽资源,造成网络堵塞,引起广播风暴。
四是网络环路:在规模较大的网络环境中,很容易出现一条双绞线同时插在一台交换机的不同端口上,这会造成网络传输性能急骤下降,访问网页都十分困难。这种问题,就是明显的网络环路现象。网络环路现象的产生,往往都是因为一条物理线缆的两端,同时接入到了交换机或路由器设备中。
五是黑客工具正在工作:一些恶意用户,可能会偷偷使用黑客软件,对局域网的稳定运行进行悄悄攻击,由于这些工具的持续工作,网络也容易产生广播风暴现象。
无论是哪种原因引起的广播风暴,对于管理经验丰富的网管员来说,他们往往会使用Sniffer之类的局域网管理软件,通过观察分析交换端口流量等方法,来寻找网络中的广播风暴源头,不过对于经验不多的网管员来说,使用上述方法显然有点勉为其难。为了快速定位广播风暴源头,单位网管员首先将故障现象报告给了本地宽带服务提供商,请他们前来测试宽带光纤线路连通性,经过专业技术人员的反复测试,确认A楼、C楼的光纤线路通过转换器,可以顺畅地连接到网络中心的核心路由交换机,专业技术人员认为问题还是出在局域网内部,必须自行解决。
不得已,单位网管员采用了最简单的办法,他断开连接A、B、C楼的网络连接,仅将来自网络中心的交换机连接保留了下来,然后在中心机房的某台计算机中使用ping命令,不停测试局域网网关地址的连通性,要是能够正常ping通(如图1所示),同时没有明显数据丢包现象时,那就意味着广播风暴位置肯定位于网络中心之外的计算机中。接着,依次将A、B、C楼的网络连接重新接上,同时观察ping命令测试结果,如果某一座楼的连接恢复接入时ping命令测试失败,或数据丢包现象非常严重,基本就能断定是对应大楼内计算机的问题。
按照同样的操作方法,到特定大楼交换机现场,先拔下所有连接线缆,之后继续采用边进行ping测试,边依次插入网络线缆的方法,直至出现无法Ping通为止,引起ping测试操作失败的那个上网节点,就是局域网广播风暴的源头。再依照组网资料,准确定位到引起广播风暴现象的计算机或网络设备上,将其从局域网中断开,使用查杀病毒或更换设备的方法,消除广播风暴现象即可。
最后总结
上面的故障排查方法,对于不熟悉组网结构,或经验不丰富的网管员来说,非常简单实用。日后,大家再遇到广播风暴之类的网络故障时,不妨使用相同的方法来解决:首先请人或使用专业工具测试线路,排除物理连接问题;其次检查重要网络设备工作状态,确认交换机之类的硬件设备是否有问题;第三断开所有上网连接,通过边ping边插线方法,快速定位影响网络不通的故障节点,再采取针对性措施进行恢复。而无数的故障排查经验也告诉我们,拔线法在解决网络故障时,是最简单且容易掌握的方法。