论文部分内容阅读
随着市场竞争日益激烈,越来越多的企业使用信息系统中记录的行为制定业务流程,并希望能够通过其更好的实现目标。由于企业发展过程中的实际需求与利益权衡不断变化,因而会导致初始业务流程中的一些行为发生改变或衍生出新的行为。企业在实际发展中能够兼顾业务流程的初始行为与变化行为,对于业务流程的管理和优化尤为重要。在过程挖掘中,信息系统当前记录的行为被看作事件日志,而其中的初始行为则可以通过过程发现被构建为一个模型。将事件日志与初始过程模型相关联,往往会发现它们之间存在差异。因此,检测事件日志与初始过程模型之间的偏差,并对其进行修复一直是过程挖掘领域的重要课题。本课题在已有偏差检测与模型修复方法的基础上进行研究,主要贡献可以概括为以下四点:(1)针对事件日志与过程模型之间的偏差检测问题,已有方法将事件日志与过程模型直接对齐或者仅基于偏差发生个数确定最优对齐,因而无法根据实际情况合理的分析对齐最优性。为此本文通过排除算法与偏差总成本确定最优对齐,并将最优对齐的尺寸或对精度可能产生的影响作为附加衡量标准。采用不同案例评估性能,当对齐处理优先考虑适合度时,可得出以下两个结果:相较于直接对齐而言,提出方法可分别在包含原始事件数据的BPIC2020和真实业务流程产生的非加权案例集中提升适合度;相较于A*算法而言,所提出方法可使七个加权案例和一个非加权案例的适合度得到提升。当对齐处理优先考虑精度时,相较于A*算法而言提出方法可在一个非加权案例中提升精度回放值。(2)针对事件日志与过程模型之间的偏差修复问题,已有方法采用自循环方式将事件日志中产生的每个偏差元素独立插入初始过程模型,虽然能够保证修复后的适合度始终为1,但却是以牺牲大量精度为代价换来的。为此本文将行为关系的一致性校验与最优对齐的偏差检测相结合,基于不可回放行为模式在最优对齐中检测偏差的发生、位置以及潜在行为关系,进而将事件日志中具有直接跟随关系的偏差元素构建为满足特定行为关系的子结构。实验通过JAVA语言编写一致性度量插件Mrepair-check*用来校验修复性能,结果表明所提出方法可通过构建偏差子结构来减少事件日志的尺寸,从而在适合度为1的前提下有效提升精度。(3)针对事件日志中两种偏差具有不同回放形式的问题,已有方法采用统一的方式对日志中所有偏差进行修复,往往导致难以同时兼顾适合度和精度。为此本文实时发现事件日志与过程模型之间当前存在的变体,检测该变体中是否存在由事件日志产生的迭代偏差,并根据检测结果选择执行修复操作或配置操作。实验通过JAVA语言编写一致性度量插件Mrepair-check进行修复性能的评估。整体修复性能的评估结果表明所提出方法通过采用配置操作修复特定变体使得更多的插入偏差得到准确回放,从而在保证适合度的同时尽可能提升精度。实时修复性能的评估结果表明,在不包含迭代插入偏差的变体中使用所提出方法修复后的适合度与精度始终为1,而已有方法则需要通过牺牲大量精度来保证适合度。(4)针对模型修复在适合度与精度上的合理权衡问题,已有方法将修复后的理想适合度设置为固定值1,因此可能会由于过分追求适合度,而导致精度在一些情况下不够合理。为此本文根据事件日志中迭代偏差的总成本来预测使用配置操作进行整体优化后的适合度。在可预测适合度满足合理范围的情况下,采用配置操作对所有偏差进行修复。反之,则根据当前变体中迭代可观测偏差的校验结果执行修复或配置操作。实验通过一致性度量的两个插件Mrepair-check*和Mrepair-check进行修复性能的评估,结果表明在可预测适合度合理的情况下,基于可选择操作的实时修复方法能够使适合度最终为1,但其中一个数据集的精度却比合理范围低了 1%。然而,所提出方法能够保证适合度与精度始终合理。当可预测适合度不合理时,所提出方法与基于可选择操作的实时修复方法性能一致,且在不包含循环路径的六个数据集中比基于偏差子结构修复后的精度值提升了 8%。综上所述,提出的偏差检测方法可在不同情况下合理检测各种业务流程的偏差信息。与此同时,模型修复方法通过层层深入的方式对修复性能进行改善,并最终在适合度为1或在合理范围内时,有效改善精度。图[71];表[50];参[120]