论文部分内容阅读
当今的信息系统大多都是精确流程模型驱动的。工作流管理系统,还有ERP,CRM,和B2B,都是基于任务的工作流模型配置的。实现一个工作流设计是一个耗时间的复杂过程,而且经常在实际的工作流程和管理的工作流之间存在差异。本文给出了一个新的建模方法以支持精确流程建模,这种建模方法称为“基于日志的流程挖掘”,即从已经存在的业务流程执行过程产生的日志中挖掘出需要的工作流模型。文中用到的日志叫做“事件日志”,该日志将流程中的每个任务做为一个原子事件来处理。
文章首先介绍了工作流技术最新的发展状况,以及WfMC的工作流参考模型,然后文章总结了当前工作流建模的主要方法,提出了工作流建模领域存在的机遇和挑战。在详细讨论流程挖掘方法前,文章对与挖掘有关的技术和理论进行了描述,包括日志的数学表达模型,Petri网和工作流网的相关属性,Petri网到工作流网的映射关系等。
之后,文章讨论了最具有挑战性的问题---结构化流程挖掘。其中分为三个部分:日志预处理,流程挖掘和合理性验证。在第一部分,讨论了如何完成日志的过滤和噪音去除。第二部分是挖掘工作的核心。文章首先定义了能够被挖掘的工作流模型---结构化工作流网模型(SWF),并给出了SWF定义。由于SWF是由四种基本结构即顺序、并行、选择和循环结构组成,因此如何从日志中将这四种基本结构挖掘出来是成功的关键。文章给出了一种新的基于流程结构的挖掘方法,这种方法的基本思想是对四种基本结构进行分析的基础上,从日志中找出具有这些结构的模块,并用结点来替换每个模块。通过循环使用四种模块挖掘方法进行挖掘和替换,最后得到一个最小的日志,该日志用上面的方法不能再挖掘出新的模块,再用α算法实现最终挖掘。将挖掘结果用前面得到的模块进行替换后,得到一个容易理解的工作流网模型。最后一部分,证明用该种方法得到的工作流网是合理的,安全的,并且是容易理解的。
在第五章,本文对日志中可能出现的噪音和不完整的日志进行了分析,提出了一种基于启发式规则的解决噪音的手段。
最后,我们用C语言基于该算法编写了一个日志结构化挖掘系统,通过运行模拟日志获得足够的实验数据,对该算法的挖掘质量进行了检验分析,证明该算法在复杂流程的挖掘方面具有明显优势。