论文部分内容阅读
摘 要
FCS数据帧校验序列,采用循环冗余校验(CRC)算法,用于检测数据包在传输过程中是否损坏,为维护人员提供判断传输通道质量好坏的依据,在判断处理某些以太网传输故障过程中,借助网管系统的性能深入分析,可以迅速、准确的找出故障产生的原因,从而彻底解决故障。瑞斯康达以太网处理板8EOS-FE 与华为设备以太网板互通时需要修改FCS参数的属性。
关键词:MSAP;MSTP;FCS;设备互通
中图分类号:U463.67
一、FCS技术
FCS:数据帧校验序列,该字段包含2个字节或四个字节的ITUT-CRC,循环冗余校验(CRC)由多项式(CRC16、CRC32)产生并被加到以太网帧中,用于检测数据包在传输过程中是否损坏,为维护人员提供判断传输通道质量好坏的依据。
二、瑞斯康达MSAP与华为MSTP混合组网
1、应用背景
某大客户MSTP业务组网采用一点(GE)汇聚多点(FE)的方式实现。要求,A市A节點作为收敛节点,实现对A市B节点、C市C节点及D市D节点等三条的专线汇聚。
2、故障现象
开局之初,A点与B、C、D点之间均按照以太网业务要求配置数据,测试阶段,A与D进行 Ping测试正常,A与B、C之间不通。
3、故障分析
C市网元C采用的是华为的MSTP(155/622H Metro1000)设备,而网元A是瑞斯康达的MSAP(3500E)设备。首先可以确定的是网元A的配置是没有问题的,因为,A与D之间的业务是正常的。难道是不同厂家的设备存在互通之间的问题么(问题一)?因为网元B也是华为的MSTP(Metro100)设备,所以有理由怀疑是设备互通导致的业务不通。
后来,A市维护人员得知,在C市的网元C上有一个告警:FCS_ERR,为了排除因数据配置不匹配导致问题的存在,A市和C市的维护人员同时核查了网元A、网元B和网元C上的数据配置,均符合以太网业务配置要求, A市与C市将相应配置数据删除重新制作后,问题依然存在,A与B、C之间业务不通。因为网元B和网元C同是华为设备,而网元B并未出现类似网元C上报的告警(问题二)。于是, “FCS_ERR”这个告警初期没有引起维护人员的关注,被人为忽略了。
4、分段法解决FCS设置问题
我们首先分段查找故障原因,通过查看网元B上EFT板的性能,我们发现外部口只有收包,没有发包,再观察系统口只有发包,没有收包,并且存在错误包的历史记录,在此,可以判断问题出在两个系统口之间,为什么会出现错误包?这个时候维护人员立刻想到了那个“FCS_ERR”告警,所谓的FCS_ERR告警(FCS校验出错告警),华为给出的解释是:封装协议一致,但是协议参数如是否扰码、是否取反等内容不一致。
查看网元B华为EFT以太网板的封装协议里,关于FCS校验的设置有三种参数:FCS32、FCS16、无,默认是FCS32,再一看网元A瑞斯康达8EOS-FE以太网板的FCS校验有两种设置值:禁止、使能,默认是禁止。维护人员将“禁止”改为“使能”,通过网管观察以太网业务性能正常,A与B之间的业务Ping测试也通过了,通过分段法将查找设备互通存在的障碍将第一个问题解决了,原因是不同的厂家在FCS参数出厂默认设置上的不一致导致了业务互通的障碍,经过对FCS校验参数的修改,问题迎刃而解。
5、代替法解决告警不一致问题
那么,第二个问题该如何解释呢?网元B与网元C同是华为设备,为什么一个上报“FCS_ERR”告警,而另一个不上报?因为这个问题曾经麻痹了维护人员对“FCS_ERR”的深究,所以必须找到答案。为了更好的找到最终的原因,我们要利用代替法来解决上面的问题了。
所谓的代替法,就是搭建一个网络模型模拟问题出现的网络环境,便于更好的分析问题、解决问题。上文提到的网元A、网元B与网元C分别处于不同的网络环境里,不利于集中解决问题,接下来,我们建立一个类似的网络环境来模拟它们的关系,如图2所示。
模型H的业务配置方法与图2中的一致,即网元S汇聚网元P与网元Q,我们额外的增加一条网元P至网元Q的EPL业务,按照MSTP业务进行FCS设置,数据配置完毕,紧接着就是测试业务是否正常了。在此过程中,网元P与网元Q没有任何告警,“FCS_ERR”这个告警也没有出现过,通过网管设置发现,该告警并没有被屏蔽。
经过验证,,将网元Q(华为Metro1000V3)更换为网元R(华为155/622H)后,“FCS_ERR”这个告警会在FCS的参数设置不一致时上报。根据测试,我们也得出另一个结论,新版的华为设备(如Metro1000V3,Metro100等)只有在扰码不匹配的情况下才会上报“FCS_ERR”告警。
三、结论
我们总结出以下的问题解决方法,当瑞斯康达以太网处理板8EOS-FE与华为155/622H设备对接开通以太网业务时,华为网管侧会上报FCS_ERR告警,同时会有错误包产生,传输维护人员很容易定位问题所在,只要修改相应的FCS参数即可解决。
综上所述,由于不同的厂家在对MSTP业务理解上的不同,反映在具体设备的出厂默认设置上,导致在开通以太网业务时设备互通方面的障碍,通过对FCS校验的功能理解及性能分析,准确找到了解决问题的关键。任何蛛丝马迹都有可能成为我们破解难题的入口,注意基础理论特别是原理部分的学习和掌握,这对我们解决疑难问题,无疑将大有裨益。
参考文献
[1]http://www.huawei.com/cn .华为技术有限公司网站
[2]李永成.多业务接入平台(MSAP)的技术特点及实现.电视技术.2009
FCS数据帧校验序列,采用循环冗余校验(CRC)算法,用于检测数据包在传输过程中是否损坏,为维护人员提供判断传输通道质量好坏的依据,在判断处理某些以太网传输故障过程中,借助网管系统的性能深入分析,可以迅速、准确的找出故障产生的原因,从而彻底解决故障。瑞斯康达以太网处理板8EOS-FE 与华为设备以太网板互通时需要修改FCS参数的属性。
关键词:MSAP;MSTP;FCS;设备互通
中图分类号:U463.67
一、FCS技术
FCS:数据帧校验序列,该字段包含2个字节或四个字节的ITUT-CRC,循环冗余校验(CRC)由多项式(CRC16、CRC32)产生并被加到以太网帧中,用于检测数据包在传输过程中是否损坏,为维护人员提供判断传输通道质量好坏的依据。
二、瑞斯康达MSAP与华为MSTP混合组网
1、应用背景
某大客户MSTP业务组网采用一点(GE)汇聚多点(FE)的方式实现。要求,A市A节點作为收敛节点,实现对A市B节点、C市C节点及D市D节点等三条的专线汇聚。
2、故障现象
开局之初,A点与B、C、D点之间均按照以太网业务要求配置数据,测试阶段,A与D进行 Ping测试正常,A与B、C之间不通。
3、故障分析
C市网元C采用的是华为的MSTP(155/622H Metro1000)设备,而网元A是瑞斯康达的MSAP(3500E)设备。首先可以确定的是网元A的配置是没有问题的,因为,A与D之间的业务是正常的。难道是不同厂家的设备存在互通之间的问题么(问题一)?因为网元B也是华为的MSTP(Metro100)设备,所以有理由怀疑是设备互通导致的业务不通。
后来,A市维护人员得知,在C市的网元C上有一个告警:FCS_ERR,为了排除因数据配置不匹配导致问题的存在,A市和C市的维护人员同时核查了网元A、网元B和网元C上的数据配置,均符合以太网业务配置要求, A市与C市将相应配置数据删除重新制作后,问题依然存在,A与B、C之间业务不通。因为网元B和网元C同是华为设备,而网元B并未出现类似网元C上报的告警(问题二)。于是, “FCS_ERR”这个告警初期没有引起维护人员的关注,被人为忽略了。
4、分段法解决FCS设置问题
我们首先分段查找故障原因,通过查看网元B上EFT板的性能,我们发现外部口只有收包,没有发包,再观察系统口只有发包,没有收包,并且存在错误包的历史记录,在此,可以判断问题出在两个系统口之间,为什么会出现错误包?这个时候维护人员立刻想到了那个“FCS_ERR”告警,所谓的FCS_ERR告警(FCS校验出错告警),华为给出的解释是:封装协议一致,但是协议参数如是否扰码、是否取反等内容不一致。
查看网元B华为EFT以太网板的封装协议里,关于FCS校验的设置有三种参数:FCS32、FCS16、无,默认是FCS32,再一看网元A瑞斯康达8EOS-FE以太网板的FCS校验有两种设置值:禁止、使能,默认是禁止。维护人员将“禁止”改为“使能”,通过网管观察以太网业务性能正常,A与B之间的业务Ping测试也通过了,通过分段法将查找设备互通存在的障碍将第一个问题解决了,原因是不同的厂家在FCS参数出厂默认设置上的不一致导致了业务互通的障碍,经过对FCS校验参数的修改,问题迎刃而解。
5、代替法解决告警不一致问题
那么,第二个问题该如何解释呢?网元B与网元C同是华为设备,为什么一个上报“FCS_ERR”告警,而另一个不上报?因为这个问题曾经麻痹了维护人员对“FCS_ERR”的深究,所以必须找到答案。为了更好的找到最终的原因,我们要利用代替法来解决上面的问题了。
所谓的代替法,就是搭建一个网络模型模拟问题出现的网络环境,便于更好的分析问题、解决问题。上文提到的网元A、网元B与网元C分别处于不同的网络环境里,不利于集中解决问题,接下来,我们建立一个类似的网络环境来模拟它们的关系,如图2所示。
模型H的业务配置方法与图2中的一致,即网元S汇聚网元P与网元Q,我们额外的增加一条网元P至网元Q的EPL业务,按照MSTP业务进行FCS设置,数据配置完毕,紧接着就是测试业务是否正常了。在此过程中,网元P与网元Q没有任何告警,“FCS_ERR”这个告警也没有出现过,通过网管设置发现,该告警并没有被屏蔽。
经过验证,,将网元Q(华为Metro1000V3)更换为网元R(华为155/622H)后,“FCS_ERR”这个告警会在FCS的参数设置不一致时上报。根据测试,我们也得出另一个结论,新版的华为设备(如Metro1000V3,Metro100等)只有在扰码不匹配的情况下才会上报“FCS_ERR”告警。
三、结论
我们总结出以下的问题解决方法,当瑞斯康达以太网处理板8EOS-FE与华为155/622H设备对接开通以太网业务时,华为网管侧会上报FCS_ERR告警,同时会有错误包产生,传输维护人员很容易定位问题所在,只要修改相应的FCS参数即可解决。
综上所述,由于不同的厂家在对MSTP业务理解上的不同,反映在具体设备的出厂默认设置上,导致在开通以太网业务时设备互通方面的障碍,通过对FCS校验的功能理解及性能分析,准确找到了解决问题的关键。任何蛛丝马迹都有可能成为我们破解难题的入口,注意基础理论特别是原理部分的学习和掌握,这对我们解决疑难问题,无疑将大有裨益。
参考文献
[1]http://www.huawei.com/cn .华为技术有限公司网站
[2]李永成.多业务接入平台(MSAP)的技术特点及实现.电视技术.2009