论文部分内容阅读
摘要:随着数据通信网的快速发展,网络的规模日益庞大,网络技术也越来越复杂,针对各厂家不同网络设备不间断产生的各种告警信息,需要进行实时监控处理。目前采用各厂商提供的专业网管系统来监控、查询和维护告警信息,不利于统一管理和分析。因此构建统一的故障管理系统来对网络进行有效维护、保证网络运行质量成为移动电信运营商迫切的需求。
关键词:数据通信网 ;网络管理 ;电信管理网(TMN)
1.TMN简介
TMN是国际电信联盟电信委员会 ITU-T 提出具有标准协议、结构和接口的开放式结构系统, 它简化了多厂商混和网络环境下电信运营企业的管理模式, 降低了电信运营的管理成本。TMN的管理业务是从使用者的角度来描述对电信网的操作、组织与维护的管理活动, 其管理业务主要有以下几类:通信网日常业务和网络运行管理业务;通信网的监测、测试和故障处理等网络维护管理业务;网路控制和异常业务处理等。TMN的管理功能支持 TMN 的管理业务的实现, 满足对被管理网络的操作、维护和管理的需要。 TMN 的管理功能主要有:性能管理、故障管理、配置管理、账务管理和安全管理。TMN的每一种管理功能又可以根据所设计系统的需要分出许多子功能集。TMN的管理功能分布在管理业务的逻辑分层中, 其逻辑层次由事务管理层、业务管理层、网络管理层、网元管理层和网元层组成。 TMN的这种逻辑分层模型具有易扩展、结构简单、设计灵活、功能模块化等特性。
2.安全管理
2.1告警格式统一
由于通信网中故障设备类型不同,故障的种类也参差不齐,为了实现对网络故障信息的综合管理就有必要统一告警格式,即将每一条告警信息按照一定的格式分解出特定的数据信息,通常有告警产生时间、告警产生的设备、告警级别、告警详细描述等。
2.2告警压缩
不同网络设备的故障管理方式是不同的,产生告警信息的数量也不相同,网络设备间是互相连通的,一个设备的故障可能导致其它设备产生告警,而且网络运行过程伴随着大量的瞬间闪烁现象。因此采集到的告警信息量是庞大的,但其中很多是重复的和可以忽略的告警,而且瞬间闪烁的比例也较高,所以需要对故障信息进行压缩以减少不必要的告警。告警压缩关键在于识别重复的告警,这可以根据故障产生的设备,故障产生的时间,故障的类型,故障的级别,故障的具体信息等进行判定,具体的操作就是针对告警数据库的内容进行合并去重等处理进行压缩。
2.3告警的自动化处理
告警的自动化处理实质上是对故障的自动恢复进行处理。例如:对于被动接收的数据,在短时间内系统可能会自动恢复;瞬间闪烁现象后有的可以自动修复等,对于此类告警信息,就可以通过自动化的设置进行处理。
3.安全管理系统的关键技术
在数据采集中,除了保证告警数据的实时性,还需要体现网络连接模型的优越性。由于移动公司网络设备较多,如果采用一般的轮询方式逐一进行采集,将无法保证数据的实时性,也增加了系统的负担和系统资源的浪费。Telnet具有较强的灵活性,本文就是利用Telnet连接网络设备进行数据采集。为了能达到并发连接大量网络设备,同时还需要能实时显示故障告警信息,就需要选择合适的网络I/o模型。经过验证分析和第二章的相關理论,本文使用IOCP网络I/O模型和多线程结合的处理方式,利用优越的IOCP内存管理模式解决这个问题。
4.系统主要功能模块设计
4. 1 数据采集
数据采集是 DNMS系统通过对被管网络所有设备的资源数据、告警数据和性能数据的采集和处理, 使系统能根据所得到的数据信息及时呈现网络的运行状况, 实现对网络设备的及时维护和管理。 数据采集的过程是接口机按照网络管理员在客户端所配置的采集参数对网元设备进行所需要数据的获取, 并对获取的数据进行相应的解析后转换成系统标准的数据格式, 然后发送到通信接口, 传递给服务器。
4.2 拓扑图管理
网络拓扑图对于网络管理、故障定位和网络流量测量都是十分重要, 它主要完成拓扑信息显示、编辑、查询和拓扑资源数据的自动发现等。 网络管理员配置拓扑资源数据发现的参数, 启动拓扑发现功能, 接口机接收到拓扑自动发现命令后对信息源及下级级联的服务器和网元设备启动拓扑发现以获取相应的拓扑数据, 然后对拓扑数据进行分析, 得到拓扑数据的链路结构信息。 服务器把接收到接口机上的拓扑数据存入数据库, 以供客户端的显示和管理。
4.3 故障管理
故障管理是数据网综合管理系统中的核心功能模块, 它主要实现对告警采集得到的网元告警、系统监视得到的系统告警和性能监视得到的性能告警进行处理, 并实现告警信息的在客户端动态呈现和管理等。在客户端, 告警显示主要用告警列表分类、分级显示所有告警详细信息, 用资源树和网络拓扑图分层显示网络节点告警, 并精确定位故障发生的节点位置。 告警管理实现对告警确认、清除、故障派单、历史告警的查询等操作管理。 告警查询完成对查询条件的设置和对查询到的历史告警的显示。告警处理的告警来源主要是由接口机采集到的网元设备告警、性能数据监视生成的性能告警和系统监视生成的系统自身运行时的告警三部分组成 。性能监视定时对性能数据库查询, 将查询得到的性能值与性能阈值相匹配, 如果达到性能告警阈值就生成相应的告警数据。系统监视实时地监测网管系统本身运行的协作能力、运行的环境参数变化, 生成系统运行告警信息。
4.4 性能管理
性能管理是 DNM S系统的重要组成部分, 性能数据是网络分析的基础。 性能管理主要完成:性能数据的实时收集、统计和存储等;性能数据库的维护, 性能告警门限设置, 性能告警数据的生成;对网管系统中各物理设备以及逻辑设备的性能进行监测、分析和对其传输质量进行评估, 性能综合查询以及查询结果的报表、图示生成等。
4.5 安全管理
安全管理对全网安全操作起保障作用, 它主要实现用户密码和用户权限等管理。 用户密码管理主要实现用户密码数据加密保存和用户密码的修改等功能。 权限管理的设计思想:用户登录时, 系统对输入的用户工号和密码进行有效性检查, 根据已成功登录用户的工号, 从权限数据库读入此工号所拥有的全部权限集;用户在对系统某项功能操作时, 系统自动检查此工号的权限集中是否拥有对此功能的操作权限, 如果有此权限则进入相应的操作界面, 否则提示用户无权操作。
4.6 配置管理
配置管理是系统运行、故障管理和定位的基础, 它的设计主要实现对象类及属性、系统对象实例、参数及参数计算公式、地区信息、IP地址、用户电路、用户链路等信息配置管理,并可对这些配置信息进行增加、删除、修改、分类统计和查询操作等
5. 结语
DNM S充分融合了 TMN分層设计思想, 应用了 CORBA 通信技术以及面向对象的编程语言 , 其设计符合现代网络面向综合化集成化发展要求, 实现了集中监控、集中管理和集中维护的目标。 DNMS系统已在山东某电信公司开始运营。 下一步的工作, 我们将在面向业务和管理智能化等方面的设计实现做更进一步的探讨。
参考文献:
[1]殷卫红,耿新民.基于SNMP协议的网络管理实现技术[J].微计算机信息,2014.
[2]马坤,杨波.Telnet协议在网管系统中的应用[J].软件工程,2014.
[3]吴蔚.利用告警关联分析技术实现网络故障定位[J]. IT技术.2014.
[4]邓散,孟洛明.告警相关性分析模型在通信网故障诊断中的应用.北京邮电大学学报,2014.
关键词:数据通信网 ;网络管理 ;电信管理网(TMN)
1.TMN简介
TMN是国际电信联盟电信委员会 ITU-T 提出具有标准协议、结构和接口的开放式结构系统, 它简化了多厂商混和网络环境下电信运营企业的管理模式, 降低了电信运营的管理成本。TMN的管理业务是从使用者的角度来描述对电信网的操作、组织与维护的管理活动, 其管理业务主要有以下几类:通信网日常业务和网络运行管理业务;通信网的监测、测试和故障处理等网络维护管理业务;网路控制和异常业务处理等。TMN的管理功能支持 TMN 的管理业务的实现, 满足对被管理网络的操作、维护和管理的需要。 TMN 的管理功能主要有:性能管理、故障管理、配置管理、账务管理和安全管理。TMN的每一种管理功能又可以根据所设计系统的需要分出许多子功能集。TMN的管理功能分布在管理业务的逻辑分层中, 其逻辑层次由事务管理层、业务管理层、网络管理层、网元管理层和网元层组成。 TMN的这种逻辑分层模型具有易扩展、结构简单、设计灵活、功能模块化等特性。
2.安全管理
2.1告警格式统一
由于通信网中故障设备类型不同,故障的种类也参差不齐,为了实现对网络故障信息的综合管理就有必要统一告警格式,即将每一条告警信息按照一定的格式分解出特定的数据信息,通常有告警产生时间、告警产生的设备、告警级别、告警详细描述等。
2.2告警压缩
不同网络设备的故障管理方式是不同的,产生告警信息的数量也不相同,网络设备间是互相连通的,一个设备的故障可能导致其它设备产生告警,而且网络运行过程伴随着大量的瞬间闪烁现象。因此采集到的告警信息量是庞大的,但其中很多是重复的和可以忽略的告警,而且瞬间闪烁的比例也较高,所以需要对故障信息进行压缩以减少不必要的告警。告警压缩关键在于识别重复的告警,这可以根据故障产生的设备,故障产生的时间,故障的类型,故障的级别,故障的具体信息等进行判定,具体的操作就是针对告警数据库的内容进行合并去重等处理进行压缩。
2.3告警的自动化处理
告警的自动化处理实质上是对故障的自动恢复进行处理。例如:对于被动接收的数据,在短时间内系统可能会自动恢复;瞬间闪烁现象后有的可以自动修复等,对于此类告警信息,就可以通过自动化的设置进行处理。
3.安全管理系统的关键技术
在数据采集中,除了保证告警数据的实时性,还需要体现网络连接模型的优越性。由于移动公司网络设备较多,如果采用一般的轮询方式逐一进行采集,将无法保证数据的实时性,也增加了系统的负担和系统资源的浪费。Telnet具有较强的灵活性,本文就是利用Telnet连接网络设备进行数据采集。为了能达到并发连接大量网络设备,同时还需要能实时显示故障告警信息,就需要选择合适的网络I/o模型。经过验证分析和第二章的相關理论,本文使用IOCP网络I/O模型和多线程结合的处理方式,利用优越的IOCP内存管理模式解决这个问题。
4.系统主要功能模块设计
4. 1 数据采集
数据采集是 DNMS系统通过对被管网络所有设备的资源数据、告警数据和性能数据的采集和处理, 使系统能根据所得到的数据信息及时呈现网络的运行状况, 实现对网络设备的及时维护和管理。 数据采集的过程是接口机按照网络管理员在客户端所配置的采集参数对网元设备进行所需要数据的获取, 并对获取的数据进行相应的解析后转换成系统标准的数据格式, 然后发送到通信接口, 传递给服务器。
4.2 拓扑图管理
网络拓扑图对于网络管理、故障定位和网络流量测量都是十分重要, 它主要完成拓扑信息显示、编辑、查询和拓扑资源数据的自动发现等。 网络管理员配置拓扑资源数据发现的参数, 启动拓扑发现功能, 接口机接收到拓扑自动发现命令后对信息源及下级级联的服务器和网元设备启动拓扑发现以获取相应的拓扑数据, 然后对拓扑数据进行分析, 得到拓扑数据的链路结构信息。 服务器把接收到接口机上的拓扑数据存入数据库, 以供客户端的显示和管理。
4.3 故障管理
故障管理是数据网综合管理系统中的核心功能模块, 它主要实现对告警采集得到的网元告警、系统监视得到的系统告警和性能监视得到的性能告警进行处理, 并实现告警信息的在客户端动态呈现和管理等。在客户端, 告警显示主要用告警列表分类、分级显示所有告警详细信息, 用资源树和网络拓扑图分层显示网络节点告警, 并精确定位故障发生的节点位置。 告警管理实现对告警确认、清除、故障派单、历史告警的查询等操作管理。 告警查询完成对查询条件的设置和对查询到的历史告警的显示。告警处理的告警来源主要是由接口机采集到的网元设备告警、性能数据监视生成的性能告警和系统监视生成的系统自身运行时的告警三部分组成 。性能监视定时对性能数据库查询, 将查询得到的性能值与性能阈值相匹配, 如果达到性能告警阈值就生成相应的告警数据。系统监视实时地监测网管系统本身运行的协作能力、运行的环境参数变化, 生成系统运行告警信息。
4.4 性能管理
性能管理是 DNM S系统的重要组成部分, 性能数据是网络分析的基础。 性能管理主要完成:性能数据的实时收集、统计和存储等;性能数据库的维护, 性能告警门限设置, 性能告警数据的生成;对网管系统中各物理设备以及逻辑设备的性能进行监测、分析和对其传输质量进行评估, 性能综合查询以及查询结果的报表、图示生成等。
4.5 安全管理
安全管理对全网安全操作起保障作用, 它主要实现用户密码和用户权限等管理。 用户密码管理主要实现用户密码数据加密保存和用户密码的修改等功能。 权限管理的设计思想:用户登录时, 系统对输入的用户工号和密码进行有效性检查, 根据已成功登录用户的工号, 从权限数据库读入此工号所拥有的全部权限集;用户在对系统某项功能操作时, 系统自动检查此工号的权限集中是否拥有对此功能的操作权限, 如果有此权限则进入相应的操作界面, 否则提示用户无权操作。
4.6 配置管理
配置管理是系统运行、故障管理和定位的基础, 它的设计主要实现对象类及属性、系统对象实例、参数及参数计算公式、地区信息、IP地址、用户电路、用户链路等信息配置管理,并可对这些配置信息进行增加、删除、修改、分类统计和查询操作等
5. 结语
DNM S充分融合了 TMN分層设计思想, 应用了 CORBA 通信技术以及面向对象的编程语言 , 其设计符合现代网络面向综合化集成化发展要求, 实现了集中监控、集中管理和集中维护的目标。 DNMS系统已在山东某电信公司开始运营。 下一步的工作, 我们将在面向业务和管理智能化等方面的设计实现做更进一步的探讨。
参考文献:
[1]殷卫红,耿新民.基于SNMP协议的网络管理实现技术[J].微计算机信息,2014.
[2]马坤,杨波.Telnet协议在网管系统中的应用[J].软件工程,2014.
[3]吴蔚.利用告警关联分析技术实现网络故障定位[J]. IT技术.2014.
[4]邓散,孟洛明.告警相关性分析模型在通信网故障诊断中的应用.北京邮电大学学报,2014.