论文部分内容阅读
随着工作流技术的发展,工作流管理广泛应用到企业信息系统中。在传统的工作流生命周期中,通常由相关领域专家设计一个符合企业流程的工作流模型,然后配置相关应用系统,最后系统投入使用。但实际应用表明,流程设计者不能在工作流系统投入使用之前就设计出一个很完善的、固定不变的模型。另一方面,业务流程会随着时间推移变更。相关领域专家希望从工作流系统真正运作情况中得到有用的信息,以进行工作流模型再造。现有很多应用系统均能提供日志,这些日志记录了系统的运作情况,为工作流模型再造提供了可能。流程挖掘抽取系统提供的日志信息,挖掘业务流程的真实运作模型。增量挖掘在日志信息的基础上,结合已有旧模型信息,或领域专家的先验知识,更全面地挖掘模型。此外,日志中还包含大量时间信息。通过对这些时间信息统计可以对模型作时间性能分析,得到模型最大运转时间信息。这些从日志中学习到的信息可反馈给流程设计者,以更好地进行模型再造。
本文研究工作流模型再造阶段的两个问题:流程挖掘及工作流模型时间性能分析。在深入研究国内外相关工作的基础上,本文的主要工作及贡献如下:
1.现有研究已有多种挖掘算法,基于不同的方法体系,挖掘出符合特定条件的工作流模型,但这些算法对循环结构的支持存在缺陷。本文给出一种可学习循环结构的流程挖掘方法,该方法能处理复杂的循环结构。方法的解决思路不限于特定算法,也能适用于其余不支持循环结构的算法中。论文给予相关理论证明,并从算法复杂度、日志质量对结果的影响及方法的适用范围与推广三方面作了详细的理论探讨。最后编写实验验证挖掘效果。实验结果表明,与流程挖掘中最典型的α算法相比,该方法挖掘结果的准确度较高。
2.目前增量挖掘的研究不多。本文研究了在增量挖掘中完善操作与更新操作的细节,考虑到循环结构内及循环结构外的任务的位置变化情况,提出了增量挖掘方法。与已有工作相比,该方法能支持循环结构的增量挖掘。此外本文提出的方法还能考虑到业务流程随着时间推移,新任务出现及旧任务被取消的情况,结合已有模型及新增日志信息量,合理地处理流程变更中任务的交替。最后,给出实验验证算法的可行性。
3.本文在模糊时态工作流网基础上对模型时间性能作分析。在已有模型(或从日志中挖掘得到的模型)的基础上,通过对日志中的时间信息统计得到模糊时态工作流网中的各项参数,从而建立模糊时态工作流网。本文给出了一种基于关键路径的方法,对整个流程的最大运转时间作估算,得到流程最大运转时间的可能性分布。这些工作流模型的时间能信息可以反馈给流程设计者,有助于他们对模型的任务进行调度或对模型进行重设计。