论文部分内容阅读
随着信息系统的普及和网络技术的迅猛发展,越来越多的关键数据被存储在计算机系统中。这些计算机系统的服务一旦发生停顿、数据发生丢失和损坏将对企业造成难以估量的损失。同时企业对于系统服务和数据可用性的要求也大为提高,因为即使是短时间的系统停机也将造成业务停顿和经济损失,因此数据的容灾问题就显得尤为重要。另外,要预防灾难和及时对灾难做出反应,还需要一个可靠的、可以综合监控信息系统的监控系统。 本文结合当今企业的实际需要,对容灾和监控技术做了深入的研究,设计实现了一个容灾监控系统。容灾监控系统主要分为监控客户端、主服务器端和备用服务器端。系统的客户端采用基于java的应用程序,以具有较好的可移植性;主服务器端和备用服务器端采用了Unix下的C编程,以获取更高的执行效率和更短的响应时间;客户端与服务器端通过Socket进行通信。 容灾监控系统的主要功能是对操作系统和数据库进行实时监控,当运行发生错误时进行报警,及时通知管理员查看并做出反应。系统还可以对这些错误和异常进行分析,并且通过SQL Trace和Tkprof工具分析和获取运行出现异常和存在性能问题的SQL语句,帮助管理员找出错误和异常的原因。系统采用实时恢复数据库归档日志的方法,对主服务器端数据库进行数据同步。当数据库发生灾难性毁坏,容灾监控系统的容灾功能将进行容灾备份,从而保证业务的连续性。 传统的监控系统大都是一种主动探寻式的系统,并且是监控数据库系统运行的一些参数。本系统与传统的容灾监控软件相比,主要有以下贡献: 第一,系统采用了SOCKET通信技术、多进程(线程)技术、Java网络技术、JFC(AWT、SWING)等技术; 第二,实现了基于监控信息的容灾操作; 第三,实现了对操作系统和数据库的综合监控; 第四,能够获得运行出现异常和存在性能问题的SQL语句; 第五,实现了触发式的监控。 本系统在投入使用后,帮助系统管理员找出异常原因,尽快做出修复,减