论文部分内容阅读
作业管理系统是建立在操作系统之上的一类中间件软件,目的在于强化操作系统的批处理功能,提供对作业的提交、调度、执行及控制等机制,从而能够更加有效地利用系统资源、平衡网络负载、提高系统的整体性能。 作业管理系统具有典型的客户/服务器模型结构,由客户、通讯代理Agent、服务器三层体系结构实现。客户端提供完全的GUI用户界面,完成用户对作业流的管理及对系统的管理功能;通讯代理采用TCP/IP网络通信协议以及与平台无关的数据通讯协议来实现客户与服务器之间的完全通讯;服务器端提供对作业流的全面支持,上层由作业流定义子系统和作业流引擎负责完成对作业流的定义与执行,底层使用网络队列系统(NOS)来实现对作业的调度与执行,使用户能够最大限度地利用计算机网络系统中的各种资源,以提高执行效率、降低作业成本。 作业管理系统的可用性是一个十分重要的评价指标。作者在分析当前集群技术的基础上,提出了高可用性作业管理系统的实现模型。根据该模型,作业管理系统作为虚拟服务运行在高可用性集群上,一旦出现故障,可以透明地进行故障转移。当故障消失时,可以进行故障恢复,保证了作业运行的连续性和可用性。