论文部分内容阅读
在现代工业生产系统和其他领域,信息技术的发展为各行各业注入了新鲜的血液,提供了新的活力和驱动力,可以说IT软件系统无处不在,无所不能,已经成为了支撑社会运转的重要平台。一个成功的软件,全力开发的时间占其整个生命周期的大约1/4还不到,但是长期以来人们的思维定势都是“重开发,轻运维”,这样就导致了很多公司和企业研发团队实力十分强大,可以开发出许多很先进和高等级的IT软件系统,但是随着使用时间的推移,这些软件系统不可避免的会开始出现各种故障,运维服务却没有跟上相应的脚步。目前企业内的运维工作模式还是人工处理模式,通常是一个数人的团队来负责多个软件系统的运维工作,但是当系统规模扩大或者系统数量增加,试想还只依靠人力来管理这些系统,处理系统故障问题,保证系统正常对外提供服务,保证各种应用程序能够正常运行,将会是一件多么艰巨的任务。而且目前这种运维方式还存在以下问题:1)被动式响应,由于软件系统种类和数目繁多,而且每个软件系统就有许多参数需要被监控,可见通过人工的方式实现主动式监控是不可能的;2)问题重复发生,运维管理员每天要处理大量问题,日积月累起来其中有大量问题是重复的;3)手工处理问题,在系统运维的实际工作中,日常业务人员报告的80%的问题基本上都是重复的,目前只能通过运维人员手工处理。面对这些问题,传统的运维方式已显得力不从心,因此,本文设计了一个软件系统的运维监控系统,使运维工作从传统的手工处理转为半自动或者自动处理。本系统包括三大模块:运维管理、运维监控和故障管理,在Qt Creator平台进行开发完成的。运维管理的功能是进行软件系统的基本信息管理、软件自动安装管理和软件的版本更新记录管理;运维监控的功能是监控应用程序的运行状态,操作系统的CPU、内存、磁盘与网络的状态和进行预警;故障管理的功能是进行日志管理、软件自动升级管理和建立故障问题知识库的管理。其中,运维监控模块可以实时监控软件系统的参数,当某个参数超过设定的阈值,将提前进行预警,从而化被动为主动;故障知识库的建立就是为了收集各种故障,然后便于运维管理员学习分析并最终总结归纳出一套解决方案;软件自动安装、软件自动升级功能模块就是将归纳出的一些故障解决方案用程序实现,然后可以实现自动化处理,极大地减轻运维人员的工作负担,使他们从琐碎的日常问题中解放出来,重点考虑系统的性能、优化等重要问题。总之,本系统的主要功能就是使运维管理工作从手工处理转为半自动或自动处理。