论文部分内容阅读
网格计算(GridComputing)就是指将分布的计算机组织起来协同解决复杂的科学与工程计算问题,适用于大型科学计算和研究项目。上海高校网格-e-网格计算应用平台项目实现了将分布在不同地点的、不同单位的、不同计算结点的各种计算和信息服务资源,整合为一个单一的(虚拟的)系统。
GlobusToolkitV2.4(GT2.4)是较早期的Globus版本,在目前很多的计算网格中使用,而GlobusToolkitV4.0(GT4.0)是目前最新的可用版本。OpenPBS是同GT2.4兼容的开源软件,在网格作业管理方面具有强大的功能。
为了使得OpenPBS能够在GT4.0上发挥集群作业管理的功能,本文讨论了一种经由GT2.4将OpenPBS接入GT4.0平台的方案。本文的主要贡献在于:
首先,实现了PBS的开源版本OpenPBS与GT4.0工具包之间的兼容问题,我们以GT2.4作为中介,实现了两者之间的融合。
其次,在实现以上两者互相融合的基础上,我们考虑了今后的可扩展性问题,为OpenPBS在以后更高版本的Globus系列网格控制平台上的应用打好了基础。再次,为了适应高性能计算中对于容错功能的要求,我们在GT4.0平台中封装了容错功能模块,该模块能实现出错任务的再次递交,使得用户提交的作业能够被有效执行完毕。
本方案作为OpenPBS接入GT4.0的方案之一,是上海高校网格-e-网格应用计算平台的研究工作的一部分。该方案的研究和实现不仅为研究人员提供了一个实验平台,而且为网格技术的深入研究作出了贡献。