基于过程挖掘的系统日志符合性检测

来源 :安徽理工大学 | 被引量 : 1次 | 上传用户:htagsll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流程挖掘已经成为一种分析组织行为的方法,它从事件日志中提取知识,并提供发现、监视和增强实际流程的技术。并在过去的十几年里被用于业务流程管理(Business Process Management,BPM)和数据挖掘领域。随着越来越多过程感知信息系统的应用,记录了大量的事件数据,可以通过过程挖掘技术对这些事件数据进行分析。通常企业在初始阶段没有进行系统地建模,但在其系统中仍记录了大量的活动执行过程。随着业务的逐渐复杂,企业通常通过一些已有的过程挖掘技术,在大量实际日志中挖掘出工作流模型来更好地管理业务,从而提高工作效率,但我们往往需要符合性检测来衡量挖掘出来的模型的质量。组织极有可能在其业务流程之间具有相似性、差异性和多样性。为了协调并使这些流程更加有效和高效,有必要对现有过程之间的相似性和差异性进行分析。业务流程相似度(Business Process Similarity,BPS)是识别两个不同业务流程间相似度的活动。同时,过程感知信息系统的实现,支持在构建时进行流程模型配置,以及在运行时更改流程实例。各自的适应导致了大量流程模型的变体,这些变体是从一个流程模型派生出来的,但在结构上略有不同。一般来说,配置和维护这样的模型变体是非常昂贵的。对流程模型与其流程变体相似性的研究,有利于减少流程变体对未来流程配置和适应的需求,以便于维护和降低成本。本文以Petri网理论为基础,结合行为轮廓知识与活动的发生关系,对流程模型及其流程变体的相似性、不同业务流程间的相似性进行了分析,并给出事件日志与流程模型的符合性度量方法。(1)针对已有研究对距离相同的流程变体无法进一步区分的问题,利用行为轮廓在描述流程模型相似性方面强大的分析功能,提出了基于行为轮廓的距离相似性分析方法。在流程族的模型距离相等的基础上引入行为轮廓相似性度,利用二维度量指标,将流程族模型的结构特性和行为特性进行综合评判,更加全面的分析流程模型及其流程变体的相似程度,解决已有文献使用单—维度无法区分流程变体间差异的问题。(2)针对现有的流程模型行为相似性度量方法大都基于变迁的发生序列,存在时间复杂度较高的问题,提出一种基于活动发生关系的流程相似性度量方法。首先,提出左右集概念,并引入违背度和左右集权重α,β,根据活动间的发生关系是否变化,确定权重取值,计算活动的相似性;然后,将流程中活动的相似性归一化处理,给出流程的相似性定义,并提出基于活动发生关系的流程相似性算法(Activity Occurrence relation,AOR),进行业务流程的相似性度量。(3)过程挖掘领域使用事件数据来发现流程模型,符合性检测可以评价挖掘模型的质量。针对现有的符合性检测方法大都基于单个活动的对齐,且只给出模型与日志的快速匹配方法,存在非块结构模型不敏感的问题,提出一种基于直接后继关系对齐的过程符合性检测方法。首先根据直接后继关系,以紧邻活动对的方式展现模型与日志中相关属性,然后根据基于紧邻活动对的最优对齐算法(Adjacency Activity Pair,AAP),得到轨迹的最优匹配活动对序列,提出基于最小代价的单条迹与模型的拟合度函数,并给出拟合度算法(Difference Fitness Algorithm,DFA),度量日志与模型的符合性。本文共有2个主要实验,分别用以验证基于直接后继关系对齐的拟合度算法和基于活动发生关系的流程相似性算法,两个实验结果表明了两个算法的可行性。另外,还通过人工编纂的模型来检验拟合度算法和相似性算法的性能体现,记录算法的运行时间,通过与已有的主流法作比较,说明本文算法的运算效率在一定程度上优于其他算法。本文主要研究内容和贡献如下:(1)提出一种流程模型及其流程变体的相似性度量方法,有效区分了距离相等的流程族模型。(2)设计了基于活动发生关系的流程相似性算法,该方法结合活动在左右集上的结构特征与活动间发生关系变化情况,从结构和行为综合分析,度量不同流程的相似性。(3)基于直接后继关系,首次提出紧邻活动对对齐概念,并提出基于紧邻活动对的最优对齐算法,以寻找待匹配迹与模型执行迹的最优对齐,定义基于最优对齐的代价函数,进而计算模型与日志拟合度。该方法能够较快匹配执行迹与待匹配迹,并给出模型与日志的符合性度量方法。图[12]表[9]参[79]。
其他文献
玻利维亚秋海棠‘Crackling Fire’(Begonia boliviensis cv.‘Crackling Fire’)属于秋海棠科秋海棠属,为多年生球根植物,由德国班纳利种子公司研植的新品种,深受市场欢迎,
乳腺癌是女性最高发的恶性肿瘤之一,据相关数据显示:乳腺癌已经成为我国女性中致死率最高的癌症。由于乳腺癌细胞组织对电磁能量的吸收比乳腺正常组织高2-5倍,这种特性差异使得微波热声成像(MITAT)在乳腺癌临床检测中具有巨大优势。MITAT是一种是基于热声效应的新型低成本的非侵入式成像技术,它同时具有微波成像的高对比度和超声成像的高空间分辨率,且具有深层病灶成像的潜力。而超声成像技术对淋巴结敏感性较高
电子产业的迅速发展对多层陶瓷电容器(MLCC)的容量要求越来越大,介质层薄膜化,电极贱金属化是MLCC发展的必然趋势。贱金属化需要介质材料和内电极在还原气氛下共烧,而MLCC常用
直链淀粉苯基氨基甲酸酯类衍生物是颇受欢迎的一类手性识别材料,其苯环上引入的不同取代基对该类衍生物的手性识别性能会产生较大影响。近年推出的Chiralpak IG商品化手性柱表现出不同于传统手性柱的独特手性识别性能,但直至目前对其手性识别机理尚不清楚。该手性柱的手性选择剂——直链淀粉-三(3-氯-5-甲基苯基氨基甲酸酯)在其苯环上同时具有一个吸电子和一个供电子基团,这一独特的侧基结构可能对其优秀的手
函数型数据分析是一种新型非参数统计方法,它的优势在于借助化零为整的分析思想,将离散数据视作具有内在统一结构的函数。本文运用函数型数据分析的方法对股票市场中的股票资金流强度指标进行研究。本文基于函数型数据分析对股票资金流强度做了以下研究。首先,根据股票资金流强度指标的求和模型建立了股票资金流强度指标的积分模型,积分模型可以更好的刻画股票交易连续不断的过程,更好的处理高频数据;其次,对所建立的股票资金
随着科技的发展,物质生活极大丰富,生产生活过程中的人工生产逐渐有被机械化生产取代的趋势。但机械仪器在机械化生产的过程中会不可避免的产生振动,影响正常的生产生活。阻尼材料作为一类可以将机械振动转化为热能的材料,具有很好的减振能力,从而达到保护仪器和操作人员的目的。聚氨酯弹性体由于其软硬段特殊结构而具有很好的阻尼性能,具有良好的应用前景。本文将这种聚氨酯应用于阻尼材料领域,并从不同的振动响应方式、聚氨
本文主要研究了耗散修正的Camassa-Holm方程解的存在唯一性、随机修正的Camassa-Holm方程解的适定性以及随机修正的Camassa-Holm方程解的大偏差原理,主要内容为:第一章中,主
聚合物驱是一种应用广泛、技术成熟的三次采油方法。目前,聚合物在应用过程中面临各种稳定性问题:由于聚合物在配制泵送经过管线、井筒以及近井地带进入地层过程中的剪切降解
瞬态器件允许在外部刺激或相关命令的控制下改变物理形式和设备功能,在信息安全,生物医学护理和环境方面具有非常广泛的应用前景。丝素蛋白材料作为美国食品药品管理局批准的医用材料,由于其良好的体外和体内生物相容性,优异的机械性能,已被用于生物医学领域。在本文中,受破茧成蝶启发,通过热敏微球可控破坏基于丝素蛋白材料的电子器件,实现了丝素蛋白基瞬态溶解电子器件的构筑。1、利用微流控毛细套管双乳液方法成功地制备
随着泛在电力物联网建设的深入推进,配电自动化、电能计量等配电网终端设备的爆发性增长,海量的业务接入对配电通信接入网实时性、安全性提出了更高的要求。无线专网具有高可靠性、高带宽、易扩展的特点,能够传输电力控制类业务,是满足业务爆发式增长需求,解决配电网“最后一公里”终端业务接入难题,提升配电通信网安全稳定运行的重要手段。本文以徐州地区电力无线专网建设为研究对象,首先介绍了电网与电力通信网的关系及发展