论文部分内容阅读
近年来,随着网络规模的扩容,异构程度地不断增加,网络技术有了长足的进步,现代网络已经演变成为一个复杂、多元化的“大系统”。对网络环境的监控、测试、分析和告警,是网络稳定运行的重要保证。自主研发高性能、高效率、自动化的故障管理系统成为企业的重中之重。本文是依托于公司异构存储统一容灾的项目,基于保证各类应用在容灾备份中心中数据的一致性,为存储网络和信息安全所研制的一种基于Agent的统一故障管理系统。本文在研究和总结了SNMP协议和网络管理相关的基础上,采用分布式多层结构的系统架构实现了一个统一故障管理系统。本文的主要工作和取得的成果如下:1.通过对SNMP协议框架和网络故障管理系统及网络管理系统实现的分析和研究,提出一种支持前端服务器/后端服务器的分布式多层结构的系统架构。2.对前端Manager平台和后端Agent平台进行了详细的设计。在故障管理平台上,主要对告警信息的收集、告警信息关联性分析、检测工具、系统适配器等主要功能设计。在Agent平台上基于标准的SNMP框架下设计了系统的组件,主要是告警消息的发送和接收、身份验证和加密、控制管理对象访问等功能组件。3.根据软件的功能需求,对告警信息模块中告警信息参数、新告警产生、告警确认/未确认、严重性等级、清除、汇总、同步等详细的分析和设计。4.通过代理工作流程的分析,对设置告警心跳周期、告警信息过滤、告警信息重传、告警信息汇总及告警信息同步功能模块进行实现。5.根据功能模块设计原则及实现技术实现了统一故障管理系统中告警信息管理软件,并对其在实际企业使用环境中进行了测试。同时,本文在统一故障管理系统中告警信息管理软件的研究中提出了创新点为:提出了一种支持前端服务器/后端服务器的分布式多层结构的系统架构。分布式多层结构可以把已存在的管理系统集成进来,在不提供综合网管的前提下也可以管理分离的多个网络。在处理流程上,进行优化设计,可以满足管理多个节点,平均每秒100个告警的处理速度。并且具有很好的伸缩性和扩展性,并支持新旧系统的兼容。同时还支持了高可用性等高级功能。