浅谈通过“六步法”提高通信网络设备故障监控效率

来源 :数字化用户 | 被引量 : 0次 | 上传用户:efan913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】首先根据当前电信运营商形势提出问题,然后具体介绍六步法的每个步骤,最后进行成效分析。
  【关键词】六步法 告警 监控 通信
  一、引言
  随着全业务牌照的发放,通信行业业内竞争加剧,在机遇与挑战面前,各大运营商一手抓网络建设,一手抓市场经营,两者相辅相成缺一不可。
  为适应市场需求,运营商的网络规模也在不断扩大,设备类型与设备数量激增。如何有效地对全网设备进行监控,并能从海量的设备告警中准确、及时、精简地派单到末端维护人员,成为了网络维护工作的重中之重。
  二、六步法
  以浙江省为例,某运营商使用综合监控平台对全网设备告警进行统一监控,日均告警量约为120万左右,但日均故障工单的派发量为约3000张,派单比仅为1:400。效率如此之高的原因,是因为从原始告警产生到派发工单经过了六道环节,每道环节均可有效筛选告警,我们称之为“六步法”。
  (一)六步法概述。“六步法”是基于告警处理规则,并从综合监控平台收到设备原始告警开始进行的逐步筛选、过滤、优化,并最终派发故障工单的过程。具体步骤如下:1、告警标准化:将各设备厂商自行定义的告警级别重新梳理,形成告警标准化集合,告警分为1-4级,剔除无效告警,从而大幅减少告警数量;2、屏蔽工程告警:凡是由于工程引起的网元告警均进行工程预约,由此产生的工程告警将不进行监控和工单派发;3、告警关联:对于同源告警进行关联,抑制告警呈现与工单派发数量;4、优化派单规则:配置故障工单派发规则,只对关注的告警进行细化派单。对1、2级告警全量派单,3、4级告警进一步细化派单规则,部分3级告警不派单,少量4级告警纳入派单;5、派单时延配置:配置告警派单时延,告警历时超过门限后才进行派单。根据告警的影响制定分等分级响应和通知机制,如低级别告警延长工单受理响应时长,高级别告警增加IVR语音通知功能;6、工单压缩:对派单后的工单进行追加合并。
  (二)告警标准化。为实现设备告警的规范化、标准化,须对原始告警进行全量梳理,并根据告警的相关属性、特性重新组合告警的内容,并在综合监控平台上呈现。从原始告警产生到综合监控平台告警分级呈现。
  告警标准化工作在设备到综合监控平台侧实现了告警解析标准化(KEY值获取,实现告警定位)、告警信息标准化(告警标题格式、告警正文格式)、告警定义标准化(重定义网管告警级别、对业务和设备的影响等),将各类原始告警进行了梳理和归类,同时结合运维管理的需要,提出了标准化的要求。另外,根据告警预处理的工作要求,对综合监控平台提出了智能化手段要求,在实现标准化工作的过程中,进行了告警关联标准化的定义工作。
  (三)屏蔽工程告警。工程告警管理的目的,旨在通过明确各维护单位的工作职责,规范操作流程,包括对工程施工的各类信息做到事前及时、准确的发布,工程期间对相关告警进行有效的标识,事后进行统计和分析,以期达到保障网络安全与提高工作效率为目的。
  (四)告警关联。网络监控人员面对移动通信网络中产生的大量告警信息,往往很难从中找出故障的真正原因,从而无法快速实施故障修复和障碍排除。为了更好的解决故障,需要对所接收的告警信息进行关联分析和处理,以便准确、快速地定位故障原因,压缩派单量,确保监控部门、专业维护部门执行高效,提升故障处理质量。
  典型案例:以基站为主体的跨专业告警关联:当发生无线基站退服告警时,触发跨专业关联规则,首先无线内告警合并归类,通过基站所属机房查找24小时内同一机房内的动力告警,然后通过基站关联的电路查找15分钟内电路A-Z两端的端口告警,如果有查找动力或者传输专业的告警,则生成跨专业衍生告警,关联所有相关无线、传输、动力专业告警,并通过一定的规则判断出基站退服的故障产生的根源原因,并派单到根源故障的末端受理班组。
  (五)延迟派单。配置告警派单时延,告警历时超过门限后才进行派单。为减少休息时间对一线维护人员的影响,根据告警的影响制定分等分级响应和通知机制,如低级别告警延长工单受理响应时长,高级别告警增加IVR语音通知功能。配置告警派单时延的另一个重要原因是告警自动恢复。大量告警在发生后会在短时间内自动恢复,维护人员无需对这些告警处理。不同专业告警应根据告警自动恢复的概率统计制定合理的告警时延,使派单效率达到最高。
  (六)优化派单规则。配置派单规则,只对关注的告警进行细化派单。在标准化基础上对3、4级告警进一步细化派单规则,部分3级告警不派单,少量4级告警纳入派单。
  随着集中化运维工作的推进,要求告警派单直接派往末端班组。部分设备由于网络不同网络层次的管理职责划归到不同维护对象,可以根据网元设备级别、设备型号、设备属性、业务类型进行派单落地。
  派单规则中,可通过设备的相关属性,进行派单细化,根据设备属性进行工单落地区分,根据维护职责落地到对应的维护班组。如:区县信息、传输设备级别、基站类型、光路信息、电路类型、设备型号等属性。
  (七)工单压缩。派单后的工单在未报结前,如果出现同一网元同一告警,则把该告警追加合并到前一张工单中,不再产生新工单。EOMS收到综合监控平台派发的多条告警,而这多条告警之间存在事先设定的相关关系时,则EOMS将多条告警合并为1个工单,EOMS系统将除第一条告警外的信息之间追加在工单中,从而减少维护人员处理工单的工作量,提高故障处理效率业务逻辑处理。
  三、成效分析
  浙江某运营商经过近三年的项目推进,成效已初步呈现。初步验证了“六步法”有利于提高网络品质,有利于提升管理效率,有利于提高投入产出比”的工作评价标准,同时在改革推进过程中,我们也更加深刻地认识到改革的意义和必要性:(一)能够更加全面真实地掌握全省网络运维情况;(二)能够全面提升故障管理、资源管理、IT支撑手段管理、代维管理等网络管理标准化水平,提高网络管理能力;(三)能够节省人员,缩短故障处理历时,发挥集约化效能,提高工作效率。
  参考文献:
  [1]移动LABS 《集中化时代的告警处理效率提升》 http://labs.chinamobile.com/mblog/7373_31704 ,2009
  [2] 张艳琼 《综合监控》,《中国新通信》2013年09期,2013
  作者简介:崔斐,男,工程师,项目经理,常年从事大型网络监控系统的建设管理工作。
其他文献
【摘 要】本文对于空中交通流量管理发展情况以及相关存在的运算模式,进行简单的阐述,分别在地面等待策略、终端区流量管理、在寻径能力空中流量管理三个方面进行研究分析。对于这三种模式下计算方式的优缺点进行简单论述。希望有助于以后的空中交通管理发展研究。  【关键词】空中交通流量;地面等待策略;终端区排序;再寻径问题  1引言  人们生活质量的提升,对航空运输行业有了很大的推动力,这样的情况下使得航空所需
期刊
【摘 要】站位是羽毛球双打的技术基础,通过它的熟练掌握可以明确双打队友各自的职责和范围,加强进攻和防守的有效性,从而赢得比赛的主动权。本文通过对羽毛球教学和实战双打进行综合分析,对站位配合技术的运用提出新思路。  【关键词】羽毛球双打 站位配合 技术分析  在羽毛球双打比赛中,相比于临场发挥性强,节奏沉稳的单打,双打节奏更迅猛,对站位要求苛刻。双方的默契配合,完全能主宰一场球赛的胜负。 双打站位大
期刊
【摘 要】在针对青少年对互联网、手机等新媒介的使用上,人们普遍还存在着一些认识上的偏差以及误区:人们过度放大了新媒介对青少年产生的负面影响,而忽视了青少年对手机等新媒介的需求,因为以手机为例的新媒介对青少年的影响,并不是直接、即时发生作用,而是媒介因素与青少年生活因素共同发生作用的结果,与家长、教师的引导等都有密切的联系。因此,正视手机媒体对青少年的社会化影响,正确看待青少年应用手机新媒介的需求,
期刊
【摘 要】信息多元化已是当今网络发展的产物,人们对各种信息的需求和渴望度极速提高,通过各种发布客户端想获取包罗万象的媒体信息。因此,作为内容提供商,具备能够快速准确且覆盖面够足的内容汇聚能力是首要诉求。  【关键词】IP收录、WEB快编、节目分发、节目译制  一、基于IP架构的收录系统  IT化、文件化、高效化是电视台等内容需求方业务发展的必然趋势,遵循这样的大趋势发展背景下,基于IP架构的收录系
期刊
【摘 要】要了解计算机网络和它的可靠性,了解强度特别高可靠的网络,是在符合中国在经济和人们在生活中对计算机的可靠性所需要的,在简单描述计算机网络发展的历史中,从现实的角度,总结出可靠的计算机网络的设计原则,并将某个企业的计算机网络的例子,给予了完善的网络系统硬件的可靠的设计理念。通过和某研究单位的计算机网络软件设计的例子,做出了一整套可设计的方法。  【关键词】计算机 网络 可靠性 服务器  随着
期刊
【摘 要】企业在社会主义市场经济的发展过程中占据重要地位,是社会发展的主力军。加强企业政工干部队伍建设有利于提高企业的竞争力和凝聚力,使企业能够在激烈的市场中占据主动地位。但是在企业政工干部队伍建设过程中仍然存在着许多的问题,因此必须采取有效的措施加以解决。本文将着重阐述队伍建设的相关概况,分析其存在的问题并制定相应的措施。  【关键词】企业政工 干部队伍建设 分析问题 解决措施  伴随着我国社会
期刊
【摘 要】随着我们国家的进步,人民的生活水平得到了提升,人们生活质量和之前相比有了很大的提升。人们对于生活之中使用物品的需求和标准也随之增加。电视作为我们生活之中的娱乐工具之一,也发生了很大的转变。传统的有线电视网络已经逐渐转变成为了数字信号电视系统,不管是从发送端还是接收端来看,都是发生了很大的转变。不仅信号的稳定性得到了提高,同时对于人们来说也是非常好的享受和体验。本篇文章针对我们数字电视信号
期刊
【摘 要】企业文化是企业之间核心竞争力的重要组成部分,因此,笔者从以人为本、抽象和具体两个视角浅谈如何加强企业文化的构建,使企业不断发展。  【关键词】以人为本 企业家 员工 抽象 具体  在当今经济迅猛发展的时代,企业之间的主要竞争越来越体现在以企业文化为主的软实力上。因此,企业需构建具有自己特色的企业文化,以便不断发展壮大。以下是笔者在企业文化构建方面,从人、抽象与具体两个角度,为企业自身的长
期刊
【摘 要】随着现代通信技术的不断发展,在数字化管理控制流程上也进行了升级维护。其中在设备管理维护方式上定期为软件进行升级维护,修复软件程序中存在的漏洞,保证通信网路的正常运行。其次在资料控制管理方式上也进行了数字化层次的提升,对传输的数据信息在传输信道内编译码,保证传输数据信息质量的有效性。笔者再次进行了详细分析,以便于提供可参考性的数据。  【关键词】通信技术 数字化管理 控制方式 有效性  一
期刊
【摘 要】随着信息技术的不断发展和人们对各种数据形式的信息需求和交流的不断增长,使得当今的计算机网络,特别是Internet从传统的数据处理设备(如计算机)和管理工具中驳离出来,担当一个非常重要的角色——信息技术的基础设施与获取、共享和交流信息的主要工具,并成为人们在当今社会生活及工作中不可缺少的组成部分。  【关键词】企业 局域网 组建  经过了几年的迅猛发展,计算机网络已经在很多方面改变了人们
期刊