论文部分内容阅读
集群系统的应用已经深入到生产生活的各个方面。利用集群系统高性价比的并行计算能力,解决复杂模型计算、海量数据的处理等问题,成为高性能计算研究领域的重要分支。为了使集群系统正常、高效的工作以及应对集群规模的扩大,需要对集群系统中的资源进行有效的监控与管理。传统命令行监控管理集群系统的方式,要求管理者熟记大量的操作命令以及配置项,工作内容复杂且容易出现错误。近年来,随着B/S模式的发展,越来越多的集群管理系统以Web应用的方式提供给用户。通过web应用提供的交互界面可以方便的进行集群维护工作,信息的表达更加直观。本文的工作目的就是设计并实现基于Web应用的集群监控管理系统。在该课题中,本人参与了系统的需求分析、概要设计以及详细设计工作,同时独立完成了系统的代码开发并进行了功能测试。了解集群系统的相关概念与应用,可以更好地指导系统的设计工作。本文通过调研集群技术,分析集群的体系结构与工作原理,总结出集群运行过程中需要监控和管理的关键内容。在此调研工作的基础上,对系统进行需求分析与概要设计,应用软件工程中的方法,将需求转换成具体的功能模型与数据模型,作为详细设计与实现的参考依据。本系统遵循MVC软件设计典范,基于SpeedPHP框架技术进行开发。以Ganglia监控系统、TORQUE资源管理器作为底层应用,通过其提供的系统命令与接口,将二者的功能集成到Web应用当中,从而实现通过Web应用进行集群监控和管理的功能。经测试,本系统实现了预期的需求,降低了使用和维护集群系统的学习成本,具有良好的应用前景。