论文部分内容阅读
服务器集群已经成为普遍使用的高性能计算环境,随着集群节点数量和应用规模增大,对于集群计算环境和应用系统的管理变得越来越复杂,IBM提出的自主计算思想为集群的系统管理提供了一条行之有效的途径。论文分析了集群管理领域的研究现状以及自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,给出了一种以JMX管理标准为基础的基于规则的自主管理体系结构,并设计了节点代理服务模块和管理服务器的功能结构。论文提出了一种基于自主计算技术的集群节点监控管理服务机制,给出了基于规则语言的管理决策引擎的实现方法,最后,论文通过在浪潮天梭TS10000集群服务器的自主Tomcat集群的自恢复控制实例,验证了该软件的可用性和有效性,并对下一步的研究方向进行了探讨。