论文部分内容阅读
当今经济全球化的社会中,组织不可能孤立存在,组织之间的业务协作变得越来越频繁和重要,很多流程需要分布在不同地域的分支机构进行协作才能完成。为了实现业务上的协作,必须对这些组织的工作流引擎进行集成。针对目前工作流和网格在交叉领域的应用,工作流引擎以网格服务的形式,作为一种可调用的网格资源,并以集群的方式对用户提供服务,但是由于网格资源的分布性、流动性和异构性,计算故障在网格计算环境中发生的概率往往比传统机群系统要高,可靠性也是本文需要解决的关键问题。
针对以上的现状,本论文在对前人工作进行总结和分析的基础上,提出了一种工作流引擎的集成解决方案,利用服务网格作为工作流引擎的集成平台,把地理上分布的多个工作流引擎集成起来,形成一个工作流执行服务,实现分布的、异构的工作流引擎之间的业务协作。在此方案的基础上,本文重点研究该引擎集群系统的容错,解决虚拟组织下引擎集成的可用性和可靠性问题。
本文工作流引擎的集成方案主要分为两个阶段的工作:首先为了实现网格对不同类型的工作流引擎的异构性和分布性的支持,本文抽象描述了基于BPEL标准的工作流引擎的服务接口,将其嵌入到符合WSRF标准的网格服务中,设计封装为一种可集群,可调用的网格资源。下一步是利用GT4的组件MDS4实现集群系统对引擎网格资源的动态增删和资源信息管理,构建符合要求的虚拟组织。
在对现有的、成熟的分布式系统概念冗余容错技术的研究后,针对本文的系统是面向非密集型性、长时间的流程实例计算这一特点,本文分析了系统可能出现的节点错误、进程错误、服务超时错误和流程错误,并针对这四种错误设计了相应的检测和处理方法,并提出了包含容错模块和本地容错模块两级的容错框架。本文还给出了一种流程实例状态备份、迁移和恢复的容错方案,以ActiveBPEL工作流引擎为例,通过对引擎持久化过程和工作机制的分析和研究,本文解决了流程实例执行状态的备份、备份的时机策略和从备份数据中恢复流程实例的执行等问题。本文的研究以广州市科技计划项目“分布式突发卫生事件信息调查系统”为背景。由于系统中各级卫生单位的工作流引擎协作完成任务,需要进行引擎的集成。此外,本文把容错方案应用到系统中,使得整个系统性能以及可靠性上有了很大的改善。本文的研究不但可以用于业务集成领域,而且对于一般网格系统的异构资源的集成和容错都具有参考意义。