论文部分内容阅读
【摘 要】随着网络和业务的快速发展,电信市场竞争的日趋激烈,原有的专业维护系统和分散维护方式已经不能满足市场需求,运维工作正在由“面向设备、面向网络”转变为“面向业务、面向客户”。实现全网全专业的告警监控、派单和呈现。
【关键词】综合网管 专业网管 综合监控
一、前言
综合监控系统是建设在各专业网管系统基础之上,将各专业网管进行横向打通,重点解决在一个平台上实现对全专业集中监控与关联分析,并通过与EOMS(Electric Operation Maintenance System,电子运维系统)工单模块一点对接,实现故障处理的集中派单和集中处理。尝试以客户或业务的视角监控网络的运行状况,实现对网元、网络和部分集客业务的集中管理、集中维护和集中监控,提高维护效率,提升维护水平。本文通过对运营商现有OSS(Operation support system,运营支撑系统)的部署现状分析及未来综合监控在运营商的应用进行探讨。
二、系统部署现状
目前主流运营商建设的主要综合网管与专业网管有:移动综合网管、传输综合网管、接入综合网管、固网交换网管、互联网综合网管及动环等其他专业网管。各专业综合网管及专业网管的主要实现功能有:故障管理、性能管理、业务管理、资源管理、拓扑管理、报表管理、系统管理等。
对现有的网络维护情况进行分析,目前网络系统存在的主要问题:
(一)搭积木的建设模式,缺乏系统性规划。
(二)无统一的性能监控平台,各专业的性能指标监控只能由本专业的网管系统实现,无法实现集中的网络运行质量的监控。
(三)多种网络技术同时运营,网元数目较多,告警数量庞大,缺乏有效和统一的处理机制。
(四)故障派单模式分散,无法实现统一集中派单,派单量大从而导致运维人员工作量大、效率低。
(五)专业网管众多,数据难以共享形成信息孤岛,无法实现端到端的业务监控、场景监控。现有网络监控均由各专业的综合网管或厂家网管实现,导致网管系统众多、监控终端分散的现象,以其中某地市为例,目前移动网管监控终端達135台,系统60余套。网络管理人员在日常工作中不得不同时面向众多网管系统,需要重复学习和适应不同厂家的维护界面,且各专业的监控系统功能单一,无法满足网络管理和业务支撑需求。
三、综合监控系统
(一)综合监控优势
综合监控系统的优势体现在与:
1.强大稳定的信息采集功能:针对不同的数据源,可提供多种数据采集方式;
2.强大的事件处理功能:采用实时数据总线的方式和高速事件处理算法,每秒钟能够处理50条以上告警事件,通过事件的过滤、合并、重组、字段丰富等可以形成准确的告警信息,通过故障风暴处理保证事件处理高效稳定运行,满足大型网络的实时告警监视的需要;
3.故障信息的快速实时响应:采用实时数据总线的方式和高速时间处理算法,快速有效地发现故障,同时通过物理设备和逻辑数据的简单关联、客户和业务之间的简单关联处理,进一步加快了故障处理的进程,保障故障定位的准确性;
4. 多样化、多层次的故障视图定制能力:系统提供告警视图定制的功能,可以根据需要定制特定的总览和告警鸟瞰视图,可以定制需要显示的告警详细信息,告警集定制功能更能提高告警监视的效率;
5. 告警自动触发能力:可以通过告警触发网关实现向其他网管系统主动传送告警数据,如触发告警业务处理流程系统,还可以实现告警自动前转功能,如电子邮件,短消息等;
6. 系统自我管理能力:系统提供对网管系统的关键进程的监视能力,可以实时监视各进程的运行状态;
7. 系统扩展性好,数据采集平台和数据总线可以实现数据采集和事件处理器的灵活扩展,对专业采集器接口的支持,可以方便的接入新的网元和专业网管系统;系统提供了与其他资源、性能等系统的接口,可以方便灵活与其他产品集成。
(二)综合监控技术架构
综合监控系统的系统功能架构如图1所示:
1. 应用层
应用层是在核心服务层的基础上实现告警监控、性能监控、场景监控、集客监控、智能预处理、网管自身管理、安全管理等功能。网管系统对用户提供的界面形式,提供应用程序和Web浏览方式等,实现业务的展现、配置管理和应用服务。具体业务功能包括:
(1)业务呈现:告警监控、性能监控、场景监控、实时KPI、跨专业关联、专题监控、资源管理、家客集客等;
(2)配置管理:告警处理规则定制、综合告警查询统计、关联参数配置、智能预处理管理、KPI基线配置;
(3)应用服务:告警前传服务、告警关联查询、预处理服务、派单服务、告警关联分析服务、端到端分析服务、报表服务、拓扑服务、GIS服务。
2. 业务处理层
业务处理层是数据处理层完成数据的格式标准化,以及在时间、地域、网元等各种维度上的数据汇总工作,为上层应用提供不同维度和粒度的预处理数据,并实现网络告警的定位、重定义、告警屏蔽等工作。
在设计方法上,本系统实现数据结构规范化的设计理念,使原始数据通过数据采集层进入系统之后,数据处理层对这些原始数据进行归纳整理,为上层的服务层提供支持,主要包括下列几类数据处理:
(1)配置数据处理
配置信息归一化:配置数据采集到综合监控系统之后,参照中国移动规定的标准配置资源模型进行归一化、数据结构规范化,使得数据应用层的相关应用能够方便地使用这些数据,也为系统扩展打下稳固的基础。
配置数据存储:综合监控系统能够将不同种配置数据转换成以上描述的归一化标准数据格式并存储到相应的数据库中,为性能监控、告警监控、场景监控等应用提供数据支持,同时也为后续二次开发或其他的后处理提供标准的存储接口。 (2)告警数据处理
综合监控系统将采集层采集到的原始告警数据经过告警数据处理层处理,提供标准化数据服务,告警处理包括告警标准化、告警清除、告警确认、告警数据的备份和删除等处理功能。
(3)性能数据处理
性能数据采集到综合监控系统之后,进行性能数据归一化处理,设置性能告警阈值,进行性能数据汇总、存储等操作处理。
整体架构采用插件式开发的设计理念,为应用层应用提供相应的服务支持,主要包括资源模型、消息分发、任务调度、数据引擎、统一鉴权等核心服务模块。
3. 采集适配层
采集适配层主要完成网元接入协议转换、接入服务、数据采集、主动检测和采集任务调度等功能,采集直接从专业综合网管系统或者通过直连设备厂家的网管系统等其它私有接口的方式,完成网络的配置、性能、告警数据采集和网元操作维护的本地接口管理。支持接口方式包括:Corba、Socket、FTP、JDB、Telnet/SSH直连网元、Q3、SNMP、Trap等等。数据采集层的主要功能包括:数据采集分析,包括数据采集、预处理、分类处理、 告警综合处理、性能综合处理、配置综合处理等;操作通道管理,向下层网元下达指令,提取指令执行结果,对结果进行分析等。
4. 接口层
接口层负责接入网综合网管系统与其它OSS系统进行信息的交互,主要接口包括与资源管理系统、电子运维网管系统、客户网管系统、认证鉴权系统的接口和移动网管系统的接口。 网管系统还应预留并提供多种接口方式,以满足未来软件系统的接入需要。
四、综合监控在运营商的应用部署探讨
(一)综合监控系统网络建设方案
综合监控系统建议采用省中心集中部署方式,主要设备有应用服务器(HA热备),数据库服务器(HA热备)、WEB服务器与接口服务器、采集服务器、磁盘阵列、SAN光纤交换机(热备)、防火墙(热备); 1套Oracle 11g数据库软件,服务器分工情况:
数据库服务器负责数据存储功能和提供数据服务;
应用服务器负责系统中层分析处理程序的運行计算;
WEB服务器负责对系统上层应用展现等提供服务;
接口服务器负责对外部横向系统间接口程序运行;
采集服务器负责南向接口的专业网管和直连设备的采集程序运行。综合监控系统网络结构如图2所示:
1.网络安全
综合监控系统在网络组网上使用三层交换机,实现系统内所有主机的网络连接,同时该交换机还担负着通过运营商专用网络与其他专业网管通信的任务,在与专用网络互联端口上应用ACL访问列表,关闭除系统接口交互外的所有TCP/UDP端口。
在核心交换机相应端口上,通过配置ACL访问列表,只允许WEB服务器与系统服务器、数据库服务器进行访问和通信,其余的IP地址全部过滤不允许访问系统服务器,以确保系统服务器的安全性。
2.服务安全
综合监控系统两台数据库服务器之间配置高可靠性软件,利用磁盘阵列进行文件和数据的镜像,同时利用HA技术完成对主备服务器运行状态的检测,当发现主服务器服务停止或死机时,完成主备服务器进程和服务的实时切换,保证系统不间断运行。
(二)综合监控数据采集建设方案
目前综合监控系统的数据采集方式主要有以下三种:
1. 方案一(见下图)
综合监控系统直接对接各专业综合网管,采集配置、告警、性能和资源等数据,对于还没有建设综合网管的专业,综合监控系统采集平台可预留接口,等该专业建设了综合网管后,再对接其综合网管。
2. 方案二(见下图)
综合监控系统绕过各专业综合网管系统,直接对接各专业网管,采集配置、告警、性能和资源数据。
3. 方案三(见下图)
对于各专业的综合网管,如果其告警消息的完整性、实时性满足生产要求,则综合监控系统直接对接其综合网管;如果其综合网管不能满足生产要求,则综合监控系统对接专业网管;对于没有建设综合网管的专业,综合监控系统对接其专业网管。
4. 综合监控数据采集建设方案对比
根据上述三种建设方案,对建设方案进行对比分析,分析结果如下表:
综合上述三种方案对比分析,建议采用方案三进行接口对接。一方面从系统实施效果分析方案三能有效支撑生产要求;另一方面从系统建设周期与难易程度分析方案三均满足系统建设的管控要求;最后是从系统建设的投资成本及对组织架构影响与维护管理成本分析方案三符合公司的发展需求与应用推广。
五、结论
本文简要的描述了现有主流运营商的综合网管与专业网管系统现状,针对现有网管系统的现状分析其存在的问题,阐述了网管系统综合化的必然趋势,并分析了告警系统的业务需求。根据现有网管系统现状分析未来综合网管系统的建设模式,包含网络组网模式及底层数据采集模式的比较分析。
参考文献:
[1]王桂梅.综合网络管理实时告警系统的设计与实现.网络与通信,2007:27-28页
[2]龚树峰.电信综合集中告警系统.电信快报.2005:9-13页
[3]http://wenku.baidu.com/view/5087c7d380eb6294dd8
86c90.html百度文库,2010-09-25
作者简介:
严海涛,女,工程师,毕业于解放军信息工程大学,主要从事数据及信息化项目咨询和设计工作。
吕美嫦,女,助理工程师,毕业于山东理工大学,主要从事数据及信息化项目咨询和设计工作。
王 猛,男,助理工程师,毕业于西安电子科技大学,主要从事数据通信项目咨询和设计工作。
【关键词】综合网管 专业网管 综合监控
一、前言
综合监控系统是建设在各专业网管系统基础之上,将各专业网管进行横向打通,重点解决在一个平台上实现对全专业集中监控与关联分析,并通过与EOMS(Electric Operation Maintenance System,电子运维系统)工单模块一点对接,实现故障处理的集中派单和集中处理。尝试以客户或业务的视角监控网络的运行状况,实现对网元、网络和部分集客业务的集中管理、集中维护和集中监控,提高维护效率,提升维护水平。本文通过对运营商现有OSS(Operation support system,运营支撑系统)的部署现状分析及未来综合监控在运营商的应用进行探讨。
二、系统部署现状
目前主流运营商建设的主要综合网管与专业网管有:移动综合网管、传输综合网管、接入综合网管、固网交换网管、互联网综合网管及动环等其他专业网管。各专业综合网管及专业网管的主要实现功能有:故障管理、性能管理、业务管理、资源管理、拓扑管理、报表管理、系统管理等。
对现有的网络维护情况进行分析,目前网络系统存在的主要问题:
(一)搭积木的建设模式,缺乏系统性规划。
(二)无统一的性能监控平台,各专业的性能指标监控只能由本专业的网管系统实现,无法实现集中的网络运行质量的监控。
(三)多种网络技术同时运营,网元数目较多,告警数量庞大,缺乏有效和统一的处理机制。
(四)故障派单模式分散,无法实现统一集中派单,派单量大从而导致运维人员工作量大、效率低。
(五)专业网管众多,数据难以共享形成信息孤岛,无法实现端到端的业务监控、场景监控。现有网络监控均由各专业的综合网管或厂家网管实现,导致网管系统众多、监控终端分散的现象,以其中某地市为例,目前移动网管监控终端達135台,系统60余套。网络管理人员在日常工作中不得不同时面向众多网管系统,需要重复学习和适应不同厂家的维护界面,且各专业的监控系统功能单一,无法满足网络管理和业务支撑需求。
三、综合监控系统
(一)综合监控优势
综合监控系统的优势体现在与:
1.强大稳定的信息采集功能:针对不同的数据源,可提供多种数据采集方式;
2.强大的事件处理功能:采用实时数据总线的方式和高速事件处理算法,每秒钟能够处理50条以上告警事件,通过事件的过滤、合并、重组、字段丰富等可以形成准确的告警信息,通过故障风暴处理保证事件处理高效稳定运行,满足大型网络的实时告警监视的需要;
3.故障信息的快速实时响应:采用实时数据总线的方式和高速时间处理算法,快速有效地发现故障,同时通过物理设备和逻辑数据的简单关联、客户和业务之间的简单关联处理,进一步加快了故障处理的进程,保障故障定位的准确性;
4. 多样化、多层次的故障视图定制能力:系统提供告警视图定制的功能,可以根据需要定制特定的总览和告警鸟瞰视图,可以定制需要显示的告警详细信息,告警集定制功能更能提高告警监视的效率;
5. 告警自动触发能力:可以通过告警触发网关实现向其他网管系统主动传送告警数据,如触发告警业务处理流程系统,还可以实现告警自动前转功能,如电子邮件,短消息等;
6. 系统自我管理能力:系统提供对网管系统的关键进程的监视能力,可以实时监视各进程的运行状态;
7. 系统扩展性好,数据采集平台和数据总线可以实现数据采集和事件处理器的灵活扩展,对专业采集器接口的支持,可以方便的接入新的网元和专业网管系统;系统提供了与其他资源、性能等系统的接口,可以方便灵活与其他产品集成。
(二)综合监控技术架构
综合监控系统的系统功能架构如图1所示:
1. 应用层
应用层是在核心服务层的基础上实现告警监控、性能监控、场景监控、集客监控、智能预处理、网管自身管理、安全管理等功能。网管系统对用户提供的界面形式,提供应用程序和Web浏览方式等,实现业务的展现、配置管理和应用服务。具体业务功能包括:
(1)业务呈现:告警监控、性能监控、场景监控、实时KPI、跨专业关联、专题监控、资源管理、家客集客等;
(2)配置管理:告警处理规则定制、综合告警查询统计、关联参数配置、智能预处理管理、KPI基线配置;
(3)应用服务:告警前传服务、告警关联查询、预处理服务、派单服务、告警关联分析服务、端到端分析服务、报表服务、拓扑服务、GIS服务。
2. 业务处理层
业务处理层是数据处理层完成数据的格式标准化,以及在时间、地域、网元等各种维度上的数据汇总工作,为上层应用提供不同维度和粒度的预处理数据,并实现网络告警的定位、重定义、告警屏蔽等工作。
在设计方法上,本系统实现数据结构规范化的设计理念,使原始数据通过数据采集层进入系统之后,数据处理层对这些原始数据进行归纳整理,为上层的服务层提供支持,主要包括下列几类数据处理:
(1)配置数据处理
配置信息归一化:配置数据采集到综合监控系统之后,参照中国移动规定的标准配置资源模型进行归一化、数据结构规范化,使得数据应用层的相关应用能够方便地使用这些数据,也为系统扩展打下稳固的基础。
配置数据存储:综合监控系统能够将不同种配置数据转换成以上描述的归一化标准数据格式并存储到相应的数据库中,为性能监控、告警监控、场景监控等应用提供数据支持,同时也为后续二次开发或其他的后处理提供标准的存储接口。 (2)告警数据处理
综合监控系统将采集层采集到的原始告警数据经过告警数据处理层处理,提供标准化数据服务,告警处理包括告警标准化、告警清除、告警确认、告警数据的备份和删除等处理功能。
(3)性能数据处理
性能数据采集到综合监控系统之后,进行性能数据归一化处理,设置性能告警阈值,进行性能数据汇总、存储等操作处理。
整体架构采用插件式开发的设计理念,为应用层应用提供相应的服务支持,主要包括资源模型、消息分发、任务调度、数据引擎、统一鉴权等核心服务模块。
3. 采集适配层
采集适配层主要完成网元接入协议转换、接入服务、数据采集、主动检测和采集任务调度等功能,采集直接从专业综合网管系统或者通过直连设备厂家的网管系统等其它私有接口的方式,完成网络的配置、性能、告警数据采集和网元操作维护的本地接口管理。支持接口方式包括:Corba、Socket、FTP、JDB、Telnet/SSH直连网元、Q3、SNMP、Trap等等。数据采集层的主要功能包括:数据采集分析,包括数据采集、预处理、分类处理、 告警综合处理、性能综合处理、配置综合处理等;操作通道管理,向下层网元下达指令,提取指令执行结果,对结果进行分析等。
4. 接口层
接口层负责接入网综合网管系统与其它OSS系统进行信息的交互,主要接口包括与资源管理系统、电子运维网管系统、客户网管系统、认证鉴权系统的接口和移动网管系统的接口。 网管系统还应预留并提供多种接口方式,以满足未来软件系统的接入需要。
四、综合监控在运营商的应用部署探讨
(一)综合监控系统网络建设方案
综合监控系统建议采用省中心集中部署方式,主要设备有应用服务器(HA热备),数据库服务器(HA热备)、WEB服务器与接口服务器、采集服务器、磁盘阵列、SAN光纤交换机(热备)、防火墙(热备); 1套Oracle 11g数据库软件,服务器分工情况:
数据库服务器负责数据存储功能和提供数据服务;
应用服务器负责系统中层分析处理程序的運行计算;
WEB服务器负责对系统上层应用展现等提供服务;
接口服务器负责对外部横向系统间接口程序运行;
采集服务器负责南向接口的专业网管和直连设备的采集程序运行。综合监控系统网络结构如图2所示:
1.网络安全
综合监控系统在网络组网上使用三层交换机,实现系统内所有主机的网络连接,同时该交换机还担负着通过运营商专用网络与其他专业网管通信的任务,在与专用网络互联端口上应用ACL访问列表,关闭除系统接口交互外的所有TCP/UDP端口。
在核心交换机相应端口上,通过配置ACL访问列表,只允许WEB服务器与系统服务器、数据库服务器进行访问和通信,其余的IP地址全部过滤不允许访问系统服务器,以确保系统服务器的安全性。
2.服务安全
综合监控系统两台数据库服务器之间配置高可靠性软件,利用磁盘阵列进行文件和数据的镜像,同时利用HA技术完成对主备服务器运行状态的检测,当发现主服务器服务停止或死机时,完成主备服务器进程和服务的实时切换,保证系统不间断运行。
(二)综合监控数据采集建设方案
目前综合监控系统的数据采集方式主要有以下三种:
1. 方案一(见下图)
综合监控系统直接对接各专业综合网管,采集配置、告警、性能和资源等数据,对于还没有建设综合网管的专业,综合监控系统采集平台可预留接口,等该专业建设了综合网管后,再对接其综合网管。
2. 方案二(见下图)
综合监控系统绕过各专业综合网管系统,直接对接各专业网管,采集配置、告警、性能和资源数据。
3. 方案三(见下图)
对于各专业的综合网管,如果其告警消息的完整性、实时性满足生产要求,则综合监控系统直接对接其综合网管;如果其综合网管不能满足生产要求,则综合监控系统对接专业网管;对于没有建设综合网管的专业,综合监控系统对接其专业网管。
4. 综合监控数据采集建设方案对比
根据上述三种建设方案,对建设方案进行对比分析,分析结果如下表:
综合上述三种方案对比分析,建议采用方案三进行接口对接。一方面从系统实施效果分析方案三能有效支撑生产要求;另一方面从系统建设周期与难易程度分析方案三均满足系统建设的管控要求;最后是从系统建设的投资成本及对组织架构影响与维护管理成本分析方案三符合公司的发展需求与应用推广。
五、结论
本文简要的描述了现有主流运营商的综合网管与专业网管系统现状,针对现有网管系统的现状分析其存在的问题,阐述了网管系统综合化的必然趋势,并分析了告警系统的业务需求。根据现有网管系统现状分析未来综合网管系统的建设模式,包含网络组网模式及底层数据采集模式的比较分析。
参考文献:
[1]王桂梅.综合网络管理实时告警系统的设计与实现.网络与通信,2007:27-28页
[2]龚树峰.电信综合集中告警系统.电信快报.2005:9-13页
[3]http://wenku.baidu.com/view/5087c7d380eb6294dd8
86c90.html百度文库,2010-09-25
作者简介:
严海涛,女,工程师,毕业于解放军信息工程大学,主要从事数据及信息化项目咨询和设计工作。
吕美嫦,女,助理工程师,毕业于山东理工大学,主要从事数据及信息化项目咨询和设计工作。
王 猛,男,助理工程师,毕业于西安电子科技大学,主要从事数据通信项目咨询和设计工作。