论文部分内容阅读
【摘 要】利用PRTG网管系统,预警网络隐患,发现并分析网络冲击成因,保护网络运行安全。
【关键词】PRTG 分析工具 排除 NGN 隐患
一、软交换网络结构
NGN软交换网络核心侧采用阿尔卡特朗讯公司的A5020MGC及7510TG设备。这套设备现为双平面业务分担模式 ,共承担四十余万语音用户。
PRTG网管
PRTG网管系统配置了PRTG主服务器和探针服务器两台设备。
探针服务器放置在NGN核心网内部,主要用于使用SNMP、WMI等方式定时采集各节点设备数据,再将采集到的数据发送PRTG主服务器。
PRTG主服务器放置在DCN网内部,负责接收存储探针服务器传来的数据并加以分析处理,最终通过HTTPS、app等方式将网管界面呈现给维护人员,可以提供数据报表、分析对比、告警通知等多项功能。
应用案例
7月23日登陆PRTG网管时发现多条传感器异常告警,其中一条为“NGN-2950-2至A5020MGC-IPACC流量异常高于上周平均值”,此条告警提示: NGN第二平面C2950-2交换机至MGC的端口流量大幅增加。
点击C2950端口传感器,查看30天流量数据,发现从7月19日开始,C2950交换机至NGN MGC IPACC端口的流量值明显增大,合计流量峰值从日常的700KB/S骤升为7000KB/S以上。此端口主要用来传送用户语音网关与MGC间的控制消息,也就是说PON网关与NGN的信令数据包交互流量上升了十倍。
NGN第二平面使用NetScreen208防火墙来隔离城域网接入侧和软交换核心侧,C2950控制消息流量上升的同时NS208的端口流量也从1800KB/S上升为9000KB/S,cpu占用率从12%上升为35%,接近危险值。
登陆NGN OAM,追踪PON接入侧与NGN MGC间的H.248消息,发现了大量504及410错误,每秒钟达数千次之多。
检索出错误消息的具体交互内容如下图,IP地址10.237.166.26的语音网关向NGN MGC发起注册,MGC认为此语音网关鉴权失败,向语音网关发送504错误,而语音网关在收到504错误后向MGC大量回送410错误,MGC在收到语音网关的410错误后,继续向语音网关发送504错误,由此形成大量消息循环,对NGN网络造成了严重冲击。
故障原因分析:
NGN网络中的语音网关应采用[domainAddress]方式在MGC中注册,但此语音网关错误的配置成以方式注册,导致此网关使用<10.237.166.26>格式向MGC进行注册,在接收到MGC 504网关未授权消息后,此网关继续向MGC大量回送410标识符错误消息,从而形成死循环。错误消息每秒钟达数千次之多,对NGN核心网造成极大的冲击和影响。 将此语音网关修改为正确的[domainAddress]注册方式后,语音网关在MGC注册成功,故障消失。
【关键词】PRTG 分析工具 排除 NGN 隐患
一、软交换网络结构
NGN软交换网络核心侧采用阿尔卡特朗讯公司的A5020MGC及7510TG设备。这套设备现为双平面业务分担模式 ,共承担四十余万语音用户。
PRTG网管
PRTG网管系统配置了PRTG主服务器和探针服务器两台设备。
探针服务器放置在NGN核心网内部,主要用于使用SNMP、WMI等方式定时采集各节点设备数据,再将采集到的数据发送PRTG主服务器。
PRTG主服务器放置在DCN网内部,负责接收存储探针服务器传来的数据并加以分析处理,最终通过HTTPS、app等方式将网管界面呈现给维护人员,可以提供数据报表、分析对比、告警通知等多项功能。
应用案例
7月23日登陆PRTG网管时发现多条传感器异常告警,其中一条为“NGN-2950-2至A5020MGC-IPACC流量异常高于上周平均值”,此条告警提示: NGN第二平面C2950-2交换机至MGC的端口流量大幅增加。
点击C2950端口传感器,查看30天流量数据,发现从7月19日开始,C2950交换机至NGN MGC IPACC端口的流量值明显增大,合计流量峰值从日常的700KB/S骤升为7000KB/S以上。此端口主要用来传送用户语音网关与MGC间的控制消息,也就是说PON网关与NGN的信令数据包交互流量上升了十倍。
NGN第二平面使用NetScreen208防火墙来隔离城域网接入侧和软交换核心侧,C2950控制消息流量上升的同时NS208的端口流量也从1800KB/S上升为9000KB/S,cpu占用率从12%上升为35%,接近危险值。
登陆NGN OAM,追踪PON接入侧与NGN MGC间的H.248消息,发现了大量504及410错误,每秒钟达数千次之多。
检索出错误消息的具体交互内容如下图,IP地址10.237.166.26的语音网关向NGN MGC发起注册,MGC认为此语音网关鉴权失败,向语音网关发送504错误,而语音网关在收到504错误后向MGC大量回送410错误,MGC在收到语音网关的410错误后,继续向语音网关发送504错误,由此形成大量消息循环,对NGN网络造成了严重冲击。
故障原因分析:
NGN网络中的语音网关应采用[domainAddress]方式在MGC中注册,但此语音网关错误的配置成以