论文部分内容阅读
上海通用汽车(SGM)目前拥有上海金桥、烟台东岳、沈阳北盛三大生产基地,四个整车厂,两个动力总成厂及泛亚工程技术开发中心。随着公司业务的不断发展,业务部门对IT的要求越来越高,为了保证系统的稳定高效运行,我们还需要完善IT系统的运维管理体系。SGM网络系统作为IT基础架构的重要组成部分,向公司各部门提供网络服务,为各种应用系统提供一个稳定高效的基础网络运行环境。同时我们的网络系统要能够适应新业务发展的需要,以保证和驱动业务的持续发展。上海通用计算机网络系统具有规模较大、设备种类较多、技术较复杂、网络层次和功能区域较多,现场设备运行环境较差,可用性要求很高等特点。我们这样一个网络系统的运维工作不可能靠人力完成,必须建设一个强大网络管理平台来管理和运维。本论文主要研究和讨论了为了提高上海通用网络服务质量,以保证网络稳定安全运行为目标的网络管理系统设计与实现。上海通用网络管理系统建设是采用监控和运维流程一体化的设计,以网络事件管理和网络性能管理为中心的网络服务质量管理系统。在网管系统中建设中,我们建立了网络配置管理数据库(CMDB),并创新的采用网络配置管理数据库信息,对网络事件进行适应上海通用的网络环境的关联分析和处理。本文详细分析了网络Syslog和Trap等事件的采集,及怎样对采集的网络事件进行基本的事件解析、压制和过滤、事件丰富和加强等消息处理,并介绍了初步事件处理的技术原理和实现。详细讨论了怎样在初步的消息处理基础上,对事件进行深入的智能化关联处理的策略设计和二次开发实施。在网络性能管理方面,本文详细介绍了性能管理中网络设备关键性能指标的数据采集、计算、性能閾值的设定等的技术原理及实现。本文还介绍了上海通用各基地网管平台的集成,故障和性能的集中呈现和报表生成;以及基于ITIL和ITSM的服务管理,怎样在上海通用建立以网管平台为中心的全面预警式网络管理体系。从网络管理平台运行来看,所有网络设备的事件和消息类型都能完整的采集,事件处理和呈现都及时高效,网络事件告警内容清晰,事件各属性准确,根据需求部分重要事件的内容及属性得到CMDB信息的丰富和加强,事件告警级别符合上海通用实际网络情况。故障管理方面基本做到了无漏报、无误报、无重复告警;同一故障的产生的多个事件都经过了关联处理,分析出根源事件后进行告警呈现。网络性能管理方面,通过对网络性能数据的采集、存储及统计、性能閾值设定和管理,以及对网络设备软硬件KPI指标及网络流量的性能分析和趋势预测,我们对网络设备及各子系统做到了定量和预防式的管理。SGM一线helpdesk工程师和二线网络管理人员共同以网络管理系统为中心,结合ITIL流程平台,建立起来了一套完整的网络运维模式和体系,保障了上海通用网络系统的高可用性。