论文部分内容阅读
摘要:简述DFDM分复用传输系统故障定位的基本原则,并结合多年的维护经验与大家讨论一下几种故障判断与定位的常用方法。
关键词:DFDM系统;定位原则;故障判断;操作规范
中图分类号:TN92
文献标识码:A
文章编号:1671-7597(2010)0720156-01
0 概述
DWDM(Dense Wavelength Division Multiplexing):即密集型光波复用,是能组合一组光波长用一根光纤进行传送,提高了光纤的利用率,解决了光纤资源紧张的问题。另外DWDM的一个关键优点是它的协议和传输速度是不相关的。基于DWDM的网络可以采用IP协议、ATM、SONET/SDH、以太网协议来传输数据,处理的数据流量在100Mb/s和160Gb/s之间。目前的DWDM系统可提供16/20波或32/40波的单纤传输容量,最大可到160波,系统容量从160G至1.6T或更高。
铁路以8横8纵为基础。相继建成京沪穗(800G)、东北(80G)、东南(80G)、西北(80G)、西南(80G)五大DWDM基础光传输网络环,在环路保护上采用先进的四纤环系统,故障切换保护时间控制在100ms以内,使整个传输网络具有了自愈保护能力。
随着DWDM技术的广泛普及的应用,这就需要我们维护人员能够准确快速定位和及时排除DWDM光传输系统的故障。作为一名维护人员应具有较高业务技能、熟悉相应的操作规范等,下面就和大家一起讨论波分系统的故障定位原则与常用方法。
1 DWDM系统故障定位的基本原则
故障定位的关键是:将故障点准确地定位到单站。
故障定位的一般原则可总结为三句话:先外部,后内部;先网络,后网元;先高级,后低级。
先外部,后内部:指的是进行DWDM系统故障定位时,应该首先排除外部设备的问题。这些外部设备包括光纤、接入SDH设备和掉电等。
先网络,后网元:指的是传输设备出现故障时,不只是一个单站出现告警,而是多个站点同时上报告警。这时要通过分析和判断来缩小导致故障的范围,尽快将故障定位到网元,一旦找到故障网元后,就可以集中精力通过数据分析、硬件检查、更换单板等手段排除该站的故障了。
先高级,后低级:在分析告警时应先分析高级告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警、一般告警。
2 DWDM系统故障判断与定位的常用方法
对于一般性的硬件故障,一般采用“一分析,二环回,三换板”方法。
当故障发生时,先通过对告警事件、性能数据和信号流向进行分析,初步判断故障点范围;然后通过逐段测量光功率和分析光谱,排除尾纤或光缆故障,并最终将故障定位到单板;最后通过换板或换纤排除故障。而对于较复杂的故障,则需要以下几种方法进行处理:
2.1告警、性能数据分析法:当DWDM系统故障时,一般会伴随大量的告警事件和异常性能数据,通过对这些信息的分析,可大概判断故障的类型和位置。其中最关键的是及时、方便、全面、确切、和真实获取故障信息。而获取途径有两个:一是通过网管获取;二是通过观察设备机柜、单板的运行告警灯的闪烁状态获取。
通过网管获取的告警、性能信息,能够全面反映全网设备的故障信息,哪些设备存在哪些告警以及告警发生的时间,还可以查询到历史告警,同时还可获取设备性能事件的具体数值。但如果告警、性能事件太多,可能会面临无从下手分析的困难。另外这些数据完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出现问题,通过该途径获取信息的能力将大大降低,甚至完全丧失。
DWDM系统上设计有不同颜色的运行和告警指示灯,这些指示灯的亮、灭及闪烁情况反映了设备当前的运行状况或存在的告警,是我们获取告警信息另一个途径。机柜顶上的指示灯帮助维护人员了解整个设备的工作情况,红、黄颜色指示灯分别对紧急事件、主要事件的发生。而次要告警是通过机项灯观察不到的,但设备单板告警指示闪烁。一般的单板上有红、绿两个指示灯,绿灯为运行灯,通过不同频率的闪烁次数表示单板不同的运行状态;红灯为告警灯,通过不同频率的闪烁次数表示不同级别的告警。这样通过这些指示灯的状态可以大致定位故障的类型和位置,只是所能表示的故障信息是比较有限的,进行故障分析和定位难度相对来说较大,且定位难以细化、精确。但该方法也有优势——维护人员在设备现场不依赖任何工具就可实时观察到哪块单板有什么级别的告警,而且在现场进行各种操作都比较方便,配合相关的仪表使用就能对故障进行分析、定位和处理。
2.2仪表测试法:“仪表测试法”一般用于排除传输设备外部问题以及与其它设备的对接问题。
通过光谱分析测试单板的MON口输出信号的光谱,直接仪表上读出光功率、信噪比,分析光放大板的增益平坦度,将得到的数据与原始数据比较看是否出现了比较大的性能劣化。一般情况,设备的合波板、分波板、功放单元(WBA)、光前置放大单元(WPA)等板的MON口,均可以在线测试主信道光谱。如果主信道业务受影响,则重点分析WPA、WBA的光谱;如果受损的业务只是主信道中的一路业务时,则重点分析光分、合波板的光谱。这种方法的说服力较强。
2.3替换法:“替换法”就是使用一个正常的单元去替换一个怀疑不正常的单元,从而达到定位故障、排除故障的目的。这个单元可以是一段尾纤、一块单板、一个法兰盘或一个衰耗器。这种方法适用于排除传输外部设备的问题,如光纤、法兰盘、接入SDH设备、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题。这种方法是比较实用一种方法,可以将故障定位到较细的位置。
2.4经验处理法:在一些特殊的情况下,由于瞬间供电异常、低压或外部强烈的电磁干扰,致使设备某些单板进入异常工作状态。此时的故障现象,如业务中断、ECC通信中断等,可能伴随有相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,通过复位、插拔单板,单站掉电重启,重新下发配置等手段,可有效及时排除故障,恢复业务。但建议该处理故障的办法尽量少用,因为该办法不利于故障原因的彻底查清,除非情况紧急,一般还是应尽量使用上面介绍的其它方法,或请求支援尽可能地将故障定位出来,以消除设备内外隐患。
在排除故障时,要由外部到内部排除故障可能原因,灵活应用各种故障处理方法,同时善于利用网管进行分析判断。
在日常工作中会遇到许多故障,只有掌握了DWDM故障定位与判断的各种方法,增加自己故障处理实践经验,理论联系实际,积累经验,才能做到快速、准确的处理DWDM系统的各类突发事件,缩短故障处理的时间。
本文是我对DWDM故障定位与判断方法的一点经验总结。由于本人水平有限,文中难免有错误和不足之处,敬请广大朋友们批评指正。
关键词:DFDM系统;定位原则;故障判断;操作规范
中图分类号:TN92
文献标识码:A
文章编号:1671-7597(2010)0720156-01
0 概述
DWDM(Dense Wavelength Division Multiplexing):即密集型光波复用,是能组合一组光波长用一根光纤进行传送,提高了光纤的利用率,解决了光纤资源紧张的问题。另外DWDM的一个关键优点是它的协议和传输速度是不相关的。基于DWDM的网络可以采用IP协议、ATM、SONET/SDH、以太网协议来传输数据,处理的数据流量在100Mb/s和160Gb/s之间。目前的DWDM系统可提供16/20波或32/40波的单纤传输容量,最大可到160波,系统容量从160G至1.6T或更高。
铁路以8横8纵为基础。相继建成京沪穗(800G)、东北(80G)、东南(80G)、西北(80G)、西南(80G)五大DWDM基础光传输网络环,在环路保护上采用先进的四纤环系统,故障切换保护时间控制在100ms以内,使整个传输网络具有了自愈保护能力。
随着DWDM技术的广泛普及的应用,这就需要我们维护人员能够准确快速定位和及时排除DWDM光传输系统的故障。作为一名维护人员应具有较高业务技能、熟悉相应的操作规范等,下面就和大家一起讨论波分系统的故障定位原则与常用方法。
1 DWDM系统故障定位的基本原则
故障定位的关键是:将故障点准确地定位到单站。
故障定位的一般原则可总结为三句话:先外部,后内部;先网络,后网元;先高级,后低级。
先外部,后内部:指的是进行DWDM系统故障定位时,应该首先排除外部设备的问题。这些外部设备包括光纤、接入SDH设备和掉电等。
先网络,后网元:指的是传输设备出现故障时,不只是一个单站出现告警,而是多个站点同时上报告警。这时要通过分析和判断来缩小导致故障的范围,尽快将故障定位到网元,一旦找到故障网元后,就可以集中精力通过数据分析、硬件检查、更换单板等手段排除该站的故障了。
先高级,后低级:在分析告警时应先分析高级告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警、一般告警。
2 DWDM系统故障判断与定位的常用方法
对于一般性的硬件故障,一般采用“一分析,二环回,三换板”方法。
当故障发生时,先通过对告警事件、性能数据和信号流向进行分析,初步判断故障点范围;然后通过逐段测量光功率和分析光谱,排除尾纤或光缆故障,并最终将故障定位到单板;最后通过换板或换纤排除故障。而对于较复杂的故障,则需要以下几种方法进行处理:
2.1告警、性能数据分析法:当DWDM系统故障时,一般会伴随大量的告警事件和异常性能数据,通过对这些信息的分析,可大概判断故障的类型和位置。其中最关键的是及时、方便、全面、确切、和真实获取故障信息。而获取途径有两个:一是通过网管获取;二是通过观察设备机柜、单板的运行告警灯的闪烁状态获取。
通过网管获取的告警、性能信息,能够全面反映全网设备的故障信息,哪些设备存在哪些告警以及告警发生的时间,还可以查询到历史告警,同时还可获取设备性能事件的具体数值。但如果告警、性能事件太多,可能会面临无从下手分析的困难。另外这些数据完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出现问题,通过该途径获取信息的能力将大大降低,甚至完全丧失。
DWDM系统上设计有不同颜色的运行和告警指示灯,这些指示灯的亮、灭及闪烁情况反映了设备当前的运行状况或存在的告警,是我们获取告警信息另一个途径。机柜顶上的指示灯帮助维护人员了解整个设备的工作情况,红、黄颜色指示灯分别对紧急事件、主要事件的发生。而次要告警是通过机项灯观察不到的,但设备单板告警指示闪烁。一般的单板上有红、绿两个指示灯,绿灯为运行灯,通过不同频率的闪烁次数表示单板不同的运行状态;红灯为告警灯,通过不同频率的闪烁次数表示不同级别的告警。这样通过这些指示灯的状态可以大致定位故障的类型和位置,只是所能表示的故障信息是比较有限的,进行故障分析和定位难度相对来说较大,且定位难以细化、精确。但该方法也有优势——维护人员在设备现场不依赖任何工具就可实时观察到哪块单板有什么级别的告警,而且在现场进行各种操作都比较方便,配合相关的仪表使用就能对故障进行分析、定位和处理。
2.2仪表测试法:“仪表测试法”一般用于排除传输设备外部问题以及与其它设备的对接问题。
通过光谱分析测试单板的MON口输出信号的光谱,直接仪表上读出光功率、信噪比,分析光放大板的增益平坦度,将得到的数据与原始数据比较看是否出现了比较大的性能劣化。一般情况,设备的合波板、分波板、功放单元(WBA)、光前置放大单元(WPA)等板的MON口,均可以在线测试主信道光谱。如果主信道业务受影响,则重点分析WPA、WBA的光谱;如果受损的业务只是主信道中的一路业务时,则重点分析光分、合波板的光谱。这种方法的说服力较强。
2.3替换法:“替换法”就是使用一个正常的单元去替换一个怀疑不正常的单元,从而达到定位故障、排除故障的目的。这个单元可以是一段尾纤、一块单板、一个法兰盘或一个衰耗器。这种方法适用于排除传输外部设备的问题,如光纤、法兰盘、接入SDH设备、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题。这种方法是比较实用一种方法,可以将故障定位到较细的位置。
2.4经验处理法:在一些特殊的情况下,由于瞬间供电异常、低压或外部强烈的电磁干扰,致使设备某些单板进入异常工作状态。此时的故障现象,如业务中断、ECC通信中断等,可能伴随有相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,通过复位、插拔单板,单站掉电重启,重新下发配置等手段,可有效及时排除故障,恢复业务。但建议该处理故障的办法尽量少用,因为该办法不利于故障原因的彻底查清,除非情况紧急,一般还是应尽量使用上面介绍的其它方法,或请求支援尽可能地将故障定位出来,以消除设备内外隐患。
在排除故障时,要由外部到内部排除故障可能原因,灵活应用各种故障处理方法,同时善于利用网管进行分析判断。
在日常工作中会遇到许多故障,只有掌握了DWDM故障定位与判断的各种方法,增加自己故障处理实践经验,理论联系实际,积累经验,才能做到快速、准确的处理DWDM系统的各类突发事件,缩短故障处理的时间。
本文是我对DWDM故障定位与判断方法的一点经验总结。由于本人水平有限,文中难免有错误和不足之处,敬请广大朋友们批评指正。