从事件日志中挖掘工作流模型:结构化挖掘方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:xiaoshancx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的信息系统大多都是精确流程模型驱动的。工作流管理系统,还有ERP,CRM,和B2B,都是基于任务的工作流模型配置的。实现一个工作流设计是一个耗时间的复杂过程,而且经常在实际的工作流程和管理的工作流之间存在差异。本文给出了一个新的建模方法以支持精确流程建模,这种建模方法称为“基于日志的流程挖掘”,即从已经存在的业务流程执行过程产生的日志中挖掘出需要的工作流模型。文中用到的日志叫做“事件日志”,该日志将流程中的每个任务做为一个原子事件来处理。 文章首先介绍了工作流技术最新的发展状况,以及WfMC的工作流参考模型,然后文章总结了当前工作流建模的主要方法,提出了工作流建模领域存在的机遇和挑战。在详细讨论流程挖掘方法前,文章对与挖掘有关的技术和理论进行了描述,包括日志的数学表达模型,Petri网和工作流网的相关属性,Petri网到工作流网的映射关系等。 之后,文章讨论了最具有挑战性的问题---结构化流程挖掘。其中分为三个部分:日志预处理,流程挖掘和合理性验证。在第一部分,讨论了如何完成日志的过滤和噪音去除。第二部分是挖掘工作的核心。文章首先定义了能够被挖掘的工作流模型---结构化工作流网模型(SWF),并给出了SWF定义。由于SWF是由四种基本结构即顺序、并行、选择和循环结构组成,因此如何从日志中将这四种基本结构挖掘出来是成功的关键。文章给出了一种新的基于流程结构的挖掘方法,这种方法的基本思想是对四种基本结构进行分析的基础上,从日志中找出具有这些结构的模块,并用结点来替换每个模块。通过循环使用四种模块挖掘方法进行挖掘和替换,最后得到一个最小的日志,该日志用上面的方法不能再挖掘出新的模块,再用α算法实现最终挖掘。将挖掘结果用前面得到的模块进行替换后,得到一个容易理解的工作流网模型。最后一部分,证明用该种方法得到的工作流网是合理的,安全的,并且是容易理解的。 在第五章,本文对日志中可能出现的噪音和不完整的日志进行了分析,提出了一种基于启发式规则的解决噪音的手段。 最后,我们用C语言基于该算法编写了一个日志结构化挖掘系统,通过运行模拟日志获得足够的实验数据,对该算法的挖掘质量进行了检验分析,证明该算法在复杂流程的挖掘方面具有明显优势。
其他文献
环境识别系统是智能车辆的重要组成部分,它在车辆行驶过程中对出现的各种目标进行采集和识别,可及时提取环境状况,向驾驶员做出指示或警告,或者直接控制车辆的操作,以保持交通通畅
“区域网络化制造”是先进制造技术和网络技术相结合的产物,将给我国制造业的发展带来新的机遇和挑战。区域网络制造系统把网络化制造限定到一定的具有相同特点、相同需求的
智能移动机器人是机器人研究领域的一个重要分支,有着巨大的应用潜力。当前,对智能移动机器人的研究吸引了众多学者的注意。全局路径规划则是智能移动机器人开发的重要环节之一
随着XML成为Internet/Intranet上数据表示和交换的标准,XML信息的安全问题也成为人们关切并致力解决的问题,其中,对XML文档的访问控制管理的研究是个热点问题,已有诸多文献提出了
随着虚拟现实技术的不断发展,虚拟实验的相关研究日益深入。实现虚拟实验系统的难点是如何建立合理高效的系统仿真模型,但当前的虚拟实验仿真模型在模型自身和模型控制方面还
随着多核众核体系结构的普及,多线程程序的需求越来越大。由于多线程程序的非确定性特征,导致程序的测试、调试复杂化,即多线程编写过程产生大量并发性错误,如死锁、数据竞争。现
作为我国自主研发的嵌入式实时操作系统Hopen,随着其应用领域的不断扩展,应用程序的开发速度已经不能满足日益增长的客户需求。因此本文提出Hopen-RT和Linux双内核架构,既能
由于全球化进程的不断加快,城市规模持续扩大,人们往往会处于一个完全陌生的环境之中。在这种情况下,获得有关新位置的信息成为了人们的当务之急。但是,每次询问他人不免麻烦
随着信息技术的发展,全球每年产生的信息量飞速的增长,传统的机械硬盘已经无法满足高性能存储的需求。基于闪存的固态存储器具有读写速度快,抗震性能好,功耗低等特点,越来越多的应
随着移动计算的发展以及信息访问需求的日益增长,企业应用正向移动和无线连接领域逐渐发展。企业需要更强大的移动和无线连接解决方案来扩展他们的商务应用,以获得更好的投资回