论文部分内容阅读
随着越来越多的商用程序移植到Internet上,提供高可用性服务就变的日益重要。群集系统的一大优点就是它具有软、硬件的冗余。高可用性通过侦测结点或幽灵程序的失败情况以及重新配置系统将任务和服务转移至群集系统中的其它结点以得到负载的平衡。 群集系统中的高可用性是指一组计算机以一种方式协同工作,即某一个结点机出现问题,其它计算机可以立即接管其任务及它所提供的各种服务,而不会造成整个系统的不可用,用户的感觉就像几乎什么也没发生。在高可用系统中主要需要有支持RAS特性的功能组件,它包含:资源监控、日志系统、系统健康监控等。 事实上,高可用性是一个广阔的研究领域。一个好的高可用性系统应包含一组可靠的通讯子系统、群集成员管理、quoram子系统以及并发的控制子系统等等,这包含了许多工作。 本文的研究主要集中于高可用系统中的资源统一表示、资源监视以及资源的失败迁移、日志系统的管理包括数据库高可用等。