论文部分内容阅读
各种过程感知信息系统记录下了大量可供分析的数据,这些数据为过程挖掘的发展奠定了基础。过程挖掘将记录的事件日志与过程模型联系起来,通过比较其事件的一致性,以发现事件日志中存在的问题或过程模型的不合理之处。当前对过程挖掘的研究存在以下问题:(1)事件日志与过程模型的校准问题:声明式过程模型与事件日志校准的算法效率不高;对于大规模过程模型,其校准方法存在一定的局限性;若模型中的事件有多个属性,现有的校准方法尚不能全面考虑其各个属性;(2)当业务需求发生变化时,应能根据需求对过程模型进行调整,这方面的研究有待于进一步深化。针对以上问题,本文用Petri网及其约束形式对过程建模,研究过程模型与事件日志的校准和过程模型的适应性问题。主要工作和创新点如下:(1)提出了一种基于声明式过程树模型的模型-日志校准方法针对用过程树表示的声明式过程模型与其事件日志的校准问题,提出了 一种新的模型-事件日志校准方法。分析了校准中可能出现的回溯问题及原因,给出了消除回溯的方法;对于可能出现的待定移动匹配问题,对各子树的FirAct与FolAct加以限定。由此,得到可进行无回溯校准模型应满足的条件,并进一步给出了其校准算法。以青岛市某医院的急诊住院临床路径为例,对所提算法与现有的算法进行了比较。实验结果表明,所提出的算法优于现有的校准算法。(2)提出了一种基于子校准选择与合并原则的校准算法针对基于模型分解的校准可能出现的合并冲突和伪校准问题,以降低伪校准的生成比例、提高合并校准的质量为目的,讨论了子校准的选择和合并规则;同时,分析了子校准、全校准与强相似校准之间的关系,以提高合并校准的多样性为目的,给出了一种新的校准算法。以青岛市某医院的心绞痛临床路径为例,对所提算法与已有算法进行了对比。实验结果表明,所提出的算法从合并校准的质量到合并校准的效率,都优于现有的基于模型分解的校准算法。(3)提出了一种基于事件相似度的多角度校准方法针对事件有多个属性的情况,讨论了其模型与事件日志的校准问题。通过将模型和事件日志中的事件属性在其功能领域本体中进行标注,根据其在本体树中的距离得到事件各个属性的相似度,进而确定事件之间的相似度。给出了基于事件相似度的多角度模型与日志校准算法。分析了多角度校准与简单校准之间的关系,并通过实验验证了所给算法在拟合度和精确度方面优于现有的简单校准与多角度校准方法。(4)提出了基于过程变体共性的模型自适应性方法在隐藏操作、阻塞操作和过程模型之间继承关系的基础上,给出从过程变体中抽取出过程变体共性--核心过程片断的算法。然后,基于过程模型变体的共性,对已有过程模型进行扩展,使其在体现过程变体共性的同时,可以保留自身模型特点,因此具有较好的环境适应性。最后通过实例对算法进行了说明。