论文部分内容阅读
摘要:传输系统的日常维护工作经常要求我们对各类故障进行定位并及时排除。故障定位最关键的是将故障点准确地定位到单板,然后排除故障。这就需要对故障产生的原因、处理的思路及方法有一个清晰的认识,这样才能够达到事半功倍的效果。本文简单的介绍SDH传输设备组成的传输网络中常见设备故障分析,以及针对SDH设备常见故障现象所采用的定位手法,为SDH传输网络维护提供了参考。
关键词:SDH传输系统 SDH传输设备常见故障 故障定位手法
中图分类号:TH 文献标识码:A 文章编号:1009-914X(2013)32-316-01
1.SDH传输网络中常见的设备故障分析
1.1从功能块告警流程图分析判断光传输设备的告警及原因
1.1.1对于相邻两个网元,在网管上都有R-LOS、R-LOF告警,而没有MS-RDI、MSREI,说明光缆很可能中断,因为远端劣化指示和远端误码指示无法回传。
1.1.2 如果相邻两网元本端有R-LOS、R-LOF告警,另一端有MS-RDI、MSREI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断或尾纤头脏、衰耗大,或本端收光板或对端发光板有故障。
1.1.3如果当前网元的东、西两个相邻网元都有相应的R-LOS和R-LOF,并且当前网元无法登陆,一般情况为当前网元掉电,造成两个方向光路不通。
1.2、单站中光传输设备的常见故障及原因
1.2.1光传输设备的网元无法登录,ECC不通
(1) 如果一个或部分网元无法登录,那么其原因可能是:(a) 光路衰耗大,误码过量,导致ECC通路不通;(b) 主控板故障;(c) SCC板ID拔码不正确;(d) 网元掉电、断纤。
(2) 如果全部网元不能登录,则原因可能有:(a) 网管网元SCC主控板故障;(b) 网线、网卡故障;(c) 计算机IP地址和网关网元IP地址不正确。
1.2.2公务电话不通及其原因
(1) 如果在设备调测开通期间公务不通,原因可能有:(a) 公务电话参数配置错误;(b) 开销板配置不正确;(c) 光纤连接不正确。
(2) 如果在运行中公务突然不通,原因可能有:(a)铃流板故障;(b) 公务电话损坏;(c)公务电话P/T和RING开关错误。
1.2.3系统时钟故障及原因
(a) 时钟源级别设置错误;(b) 时钟板故障导致线路时钟失锁;(c) 光纤反接导致两网元时钟互跟;(d) 线路板故障;(e)交叉板故障。
1.2.4光传输设备的常见业务故障
(1) 某2 Mbit/s输入中断告警时,原因可能有:(a) 外部设备输入中断;(b) 2 Mbit/s同轴电缆故障;(c) 电缆头焊接脱落;(d) DDF架头松动;(e) 支路板故障。
(2) 某一个VC4通道告警,原因可能有:(a) 时隙配置参数改变;(b) XC4交叉板故障。
(3) 光路不通有R-LOS、R-LOF告警,原因可能有:(a) 断纤;(b) 光纤性能劣化;(c) 尾纤头太脏,衰耗过大;(d) 光板故障,发射或接收光功率异常;(e) 使用光板型号不对。
(4) 误码过量时,设备外部原因可能有:(a) 光纤性能劣化,损耗大;(b) 光纤接头太脏,或连接不正确;(c) 设备接地不良;(d) 设备附近有强烈干扰源;(e) 设备散热不良,工作温度高;(f) 传输距离过短或过长。
设备内部原因可能有:(a) 线路板接收侧衰减过大;(b) 对端发送电路故障,或本端接收电路故障;(c) 时钟同步性能不好;(d) 支路板故障;(e) 风扇故障。
(5) 保护倒换失败及原因
单向通道保护环:(a) 逻辑系统属性配置错误;(b) 支路板通道保护属性配置错误;(c) 支路板、线路板和主控板故障。
复用段保护环:(a) 复用段节点参数改变;(b) 保护倒换协议状态不正常;(c) 交叉板、主控板或线路板故障。
1.3光传输设备的维护中常见的人为故障
(1) 更换光板时型号不统一,造成光功率过载或太低,导致光路不通,产生RLOS或误码过量等故障;(2) 在多个2 Mbit/s口同时处理和开通时,不同的2 Mbit/s线收发交叉互配,造成数据业务不通;(3) 更换SCC主控板后,忘记拔动或错误拔动ID码,导致网元无法登录;(4) 公务在使用中P/T或RING开关位置错误,导致公务不通;(5) 风扇长期不清洁,导致设备产生大量指针调整和误码;(6) 网管添加业务时不规范,发生时隙冲突,导致业务中断;(7) PGND接地不良,造成单板频繁损坏和误码;(8) 光缆错误连接导致全网业务中断;(9) 市电接入电源设备时,火线零线反接,导致SCC板反复复位;
(10) 尾纤保护不到位,导致老鼠咬断尾纤,光路中断.
2.传输故障定位的基本原则
众所周知,传输故障定位一般应遵循“先抢通后修复、先外部后传输、先单站后单板、先线路后支路、先高级后低级”的原则。
2.1先抢通后修复
在出现故障时,系统维护者要首先抢通业务然后进行故障修复。如果存在影响业务情况下的传输网络告警故障,如在2Mbit/s业务通道出现 LOS(信号丢失)告警,因外线原因导致的收无光告警,单元盘故障产生的UnitFailure(单元失效)告警等情况下产生的故障,必须首先抢通业务。不过要想先抢通业务需要一个先决条件,那就是网络中有与故障通道相同起始点的可用通道资源或与故障板件相同的可用备板。
2.2先外部后传输
在处理故障时应先排除外部的可能因素,如断纤、终端设备故障、电源或机房环境配套故障等,而后进行传输系统原因查找。当可能存在外界因素影响而产生传输网络告警故障时,如设备温度告警、光路告警、网元失效告警,也需照此原则处理。
2.3.先單站后单板
指在查找传输设备故障原因时,需要先定位到站点再定位到板件。一般设备故障时,不会只是一个站点出现告警,而是在很多站点同时上报告警。这时就需要通过分析和判断缩小范围,快速、准确地定位是哪个单站的问题,而后尽可能准确地将故障定位到单站后再具体定位到单板。如处理光路误码、光功率异常等告警处理时,需要结合业务信号流,对告警与性能事件一起进行分析。可采用环回法、替代法、数据分析法、仪表测试法来判断告警及故障产生的原因,将其定位到单板。
2.4先线路后支路
在处理故障时,如果支路出现了大量AIS告警,这时需要先排除线路板故障再查看支路板故障。由于传输系统线路板的故障常常会引起支路板的异常告警,在处理告警时,应按“先线路后支路”的顺序,排除网管告警;如支路出现大量AIS则首先查看线路板是否出现LOS告警或其他异常告警,再查看支路板告警。
2.5先高级后低级
在进行告警分析时,先分析高级别告警再分析低级别告警。特别是当高、低级别告警同时存在时,应首先分析级别高的告警,如紧急告警、主要告警,然后再分析低级别的告警,如次要告警、一般告警。处理告警时,系统维护者先处理影响业务的告警。如果这些告警是由更高一级的告警引起的,则先处理更高一级的告警,如AIS、LOP等。如果是由LOS引发的,要先处理LOS告警。
3.结论
在电力通信系统中,SDH光传输系统得到了广泛地应用。目前,SDH光传输系统已经有多种组网方式,可组成链形网、环形网、链带环网及多环网。由于SDH光传输系统组网方式的复杂性,加大了维护人员的工作量和故障定位及处理的难度,只有透过故障的表象找到其本质,才能实现故障的准确定位并迅速排除。这就需要我们了解故障定位的基本原则,明确故障处理的思路,掌握常见的故障处理方法,从而从容应对各种异常现象,提高日常维护的效果。
关键词:SDH传输系统 SDH传输设备常见故障 故障定位手法
中图分类号:TH 文献标识码:A 文章编号:1009-914X(2013)32-316-01
1.SDH传输网络中常见的设备故障分析
1.1从功能块告警流程图分析判断光传输设备的告警及原因
1.1.1对于相邻两个网元,在网管上都有R-LOS、R-LOF告警,而没有MS-RDI、MSREI,说明光缆很可能中断,因为远端劣化指示和远端误码指示无法回传。
1.1.2 如果相邻两网元本端有R-LOS、R-LOF告警,另一端有MS-RDI、MSREI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断或尾纤头脏、衰耗大,或本端收光板或对端发光板有故障。
1.1.3如果当前网元的东、西两个相邻网元都有相应的R-LOS和R-LOF,并且当前网元无法登陆,一般情况为当前网元掉电,造成两个方向光路不通。
1.2、单站中光传输设备的常见故障及原因
1.2.1光传输设备的网元无法登录,ECC不通
(1) 如果一个或部分网元无法登录,那么其原因可能是:(a) 光路衰耗大,误码过量,导致ECC通路不通;(b) 主控板故障;(c) SCC板ID拔码不正确;(d) 网元掉电、断纤。
(2) 如果全部网元不能登录,则原因可能有:(a) 网管网元SCC主控板故障;(b) 网线、网卡故障;(c) 计算机IP地址和网关网元IP地址不正确。
1.2.2公务电话不通及其原因
(1) 如果在设备调测开通期间公务不通,原因可能有:(a) 公务电话参数配置错误;(b) 开销板配置不正确;(c) 光纤连接不正确。
(2) 如果在运行中公务突然不通,原因可能有:(a)铃流板故障;(b) 公务电话损坏;(c)公务电话P/T和RING开关错误。
1.2.3系统时钟故障及原因
(a) 时钟源级别设置错误;(b) 时钟板故障导致线路时钟失锁;(c) 光纤反接导致两网元时钟互跟;(d) 线路板故障;(e)交叉板故障。
1.2.4光传输设备的常见业务故障
(1) 某2 Mbit/s输入中断告警时,原因可能有:(a) 外部设备输入中断;(b) 2 Mbit/s同轴电缆故障;(c) 电缆头焊接脱落;(d) DDF架头松动;(e) 支路板故障。
(2) 某一个VC4通道告警,原因可能有:(a) 时隙配置参数改变;(b) XC4交叉板故障。
(3) 光路不通有R-LOS、R-LOF告警,原因可能有:(a) 断纤;(b) 光纤性能劣化;(c) 尾纤头太脏,衰耗过大;(d) 光板故障,发射或接收光功率异常;(e) 使用光板型号不对。
(4) 误码过量时,设备外部原因可能有:(a) 光纤性能劣化,损耗大;(b) 光纤接头太脏,或连接不正确;(c) 设备接地不良;(d) 设备附近有强烈干扰源;(e) 设备散热不良,工作温度高;(f) 传输距离过短或过长。
设备内部原因可能有:(a) 线路板接收侧衰减过大;(b) 对端发送电路故障,或本端接收电路故障;(c) 时钟同步性能不好;(d) 支路板故障;(e) 风扇故障。
(5) 保护倒换失败及原因
单向通道保护环:(a) 逻辑系统属性配置错误;(b) 支路板通道保护属性配置错误;(c) 支路板、线路板和主控板故障。
复用段保护环:(a) 复用段节点参数改变;(b) 保护倒换协议状态不正常;(c) 交叉板、主控板或线路板故障。
1.3光传输设备的维护中常见的人为故障
(1) 更换光板时型号不统一,造成光功率过载或太低,导致光路不通,产生RLOS或误码过量等故障;(2) 在多个2 Mbit/s口同时处理和开通时,不同的2 Mbit/s线收发交叉互配,造成数据业务不通;(3) 更换SCC主控板后,忘记拔动或错误拔动ID码,导致网元无法登录;(4) 公务在使用中P/T或RING开关位置错误,导致公务不通;(5) 风扇长期不清洁,导致设备产生大量指针调整和误码;(6) 网管添加业务时不规范,发生时隙冲突,导致业务中断;(7) PGND接地不良,造成单板频繁损坏和误码;(8) 光缆错误连接导致全网业务中断;(9) 市电接入电源设备时,火线零线反接,导致SCC板反复复位;
(10) 尾纤保护不到位,导致老鼠咬断尾纤,光路中断.
2.传输故障定位的基本原则
众所周知,传输故障定位一般应遵循“先抢通后修复、先外部后传输、先单站后单板、先线路后支路、先高级后低级”的原则。
2.1先抢通后修复
在出现故障时,系统维护者要首先抢通业务然后进行故障修复。如果存在影响业务情况下的传输网络告警故障,如在2Mbit/s业务通道出现 LOS(信号丢失)告警,因外线原因导致的收无光告警,单元盘故障产生的UnitFailure(单元失效)告警等情况下产生的故障,必须首先抢通业务。不过要想先抢通业务需要一个先决条件,那就是网络中有与故障通道相同起始点的可用通道资源或与故障板件相同的可用备板。
2.2先外部后传输
在处理故障时应先排除外部的可能因素,如断纤、终端设备故障、电源或机房环境配套故障等,而后进行传输系统原因查找。当可能存在外界因素影响而产生传输网络告警故障时,如设备温度告警、光路告警、网元失效告警,也需照此原则处理。
2.3.先單站后单板
指在查找传输设备故障原因时,需要先定位到站点再定位到板件。一般设备故障时,不会只是一个站点出现告警,而是在很多站点同时上报告警。这时就需要通过分析和判断缩小范围,快速、准确地定位是哪个单站的问题,而后尽可能准确地将故障定位到单站后再具体定位到单板。如处理光路误码、光功率异常等告警处理时,需要结合业务信号流,对告警与性能事件一起进行分析。可采用环回法、替代法、数据分析法、仪表测试法来判断告警及故障产生的原因,将其定位到单板。
2.4先线路后支路
在处理故障时,如果支路出现了大量AIS告警,这时需要先排除线路板故障再查看支路板故障。由于传输系统线路板的故障常常会引起支路板的异常告警,在处理告警时,应按“先线路后支路”的顺序,排除网管告警;如支路出现大量AIS则首先查看线路板是否出现LOS告警或其他异常告警,再查看支路板告警。
2.5先高级后低级
在进行告警分析时,先分析高级别告警再分析低级别告警。特别是当高、低级别告警同时存在时,应首先分析级别高的告警,如紧急告警、主要告警,然后再分析低级别的告警,如次要告警、一般告警。处理告警时,系统维护者先处理影响业务的告警。如果这些告警是由更高一级的告警引起的,则先处理更高一级的告警,如AIS、LOP等。如果是由LOS引发的,要先处理LOS告警。
3.结论
在电力通信系统中,SDH光传输系统得到了广泛地应用。目前,SDH光传输系统已经有多种组网方式,可组成链形网、环形网、链带环网及多环网。由于SDH光传输系统组网方式的复杂性,加大了维护人员的工作量和故障定位及处理的难度,只有透过故障的表象找到其本质,才能实现故障的准确定位并迅速排除。这就需要我们了解故障定位的基本原则,明确故障处理的思路,掌握常见的故障处理方法,从而从容应对各种异常现象,提高日常维护的效果。