论文部分内容阅读
随着信息技术的迅猛发展。在国民经济各领域对信息处理能力的要求也越来越高,尤其是高性能计算方面的需求快速增长。目前对高性能计算领域影响最大的是集群,它极大地提高了高性能计算的发展,使集群系统的应用逐渐从科学研究发展到其它各领域。在集群中软硬件资源丰富,这些资源需要进行实时监控以帮助集群达到负载均衡以及调度任务的顺利完成,还要及时获得软硬件的故障信息并加以解决,确保系统的稳定。
论文重点研究了基于LSF(Load Sharing Facility)的高性能计算集群的管理系统。高性能计算集群集成了大量计算资源,在它上面利用LSF集群管理软件,集群中的各种计算资源和服务将能够被有效地管理。在大多集群系统中,管理员需要实时地监控集群计算资源和服务,用户需要能够非常方便快捷地获得服务和信息。论文提出了基于LSF集群管理软件实现一个基于Web的高性能计算集群管理系统,用于管理集群资源和计算作业,并实现高性能计算应用服务的在线管理和发布。
论文主要工作有以下几个方面:
1、高性能计算和高性能计算集群。高性能计算的普及加速了高性能计算集群的发展,理解高性能计算所需要的软件和硬件设备以及集群在高性能计算方面的优点和突出特点,充分利用集群资源执行计算任务。
2、LSF软件产品。通过研究LSF的工作原理和架构特点,以及它在集群资源和作业管理方面的方法,加深对集群管理概念的理解。
3、高性能计算应用的研究分析。理解高性能计算应用在集群的高性能计算中的作业,将高性能应用作为一种软件服务发布给用户。
4、Web高性能计算集群管理的技术研究和实现。通过研究各种Web技术,实现一个易于管理员管理和用户使用的Web集群管理系统。
5、Web高性能计算集群管理系统的测试与改进研究。对Web系统进行自动化压力测试,找到系统的不足之处,提出改进方案,并根据需求增加新的功能设计。