基于受控日志的过程挖掘及优化

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:kuofa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着业务系统的广泛使用,系统模型复杂度及日志属性多样性随之提升。系统日志与业务过程的分析和研究趋于常态化。在过程发现、一致性检测和过程改进三方面主要问题有:1)由于企业或系统拥有者需保证用户隐私、系统流程的部分不可见,日志分析研究中经常会出现缺乏有效数据,对分析算法的验证及评估造成较大影响。目前的日志生成研究会产生大量冗余的日志,导致事件间的约束不可控;2)过程挖掘是通过当今信息系统中可用日志来提取有效信息以发现、模拟和改进真实过程。现有的过程挖掘算法基于事件日志,其中仅记录任务的执行情况,对于日志其余属性的利用较少。3)一致性检验是过程挖掘领域中检验日志与模型之间偏差的有效方法,对齐是众多先进方法之一。现阶段最优对齐的成本计算大多只与对齐中移动个数保持相关,缺乏对活动依赖的分析,即缺乏对活动重要程度的考虑;4)目前的业务流程优化主要是针对管理者或开发者给出的业务流程模型,其与实际运行中的系统可能存在些许偏差,从而影响了优化结果的可行性。针对日志生成、过程挖掘、对齐计算及模型优化中存在的部分问题,本文基于Petri网理论与应用方面的研究做出以下贡献:(1)针对动态算数计算Petri模型难以通过仿真软件进行模拟,在此提出一种基于Java编程,动态构建Petri网模型并模拟运行的方法,并用于幂次方算数计算模型分析验证中,该方法使动态结构Petri网模型的计算机模拟得以实现,并为下文的日志生成提供基本框架。(2)针对缺乏有效日志或包含指定结构的系统日志对过程挖掘算法进行验证,已有的方法是采用随机生成树并生成随机日志,在此提出基于增广Petri网生成受控日志的方法,此方法可对指定结构模型进行可编辑受控日志的生成,同时支持对多重集日志的转换,并应用于下文过程挖掘及对齐计算中。(3)针对现有日志除活动标签外有大量可用属性,现有过程挖掘算法大多缺乏对日志中活动标签外属性的利用,在此提出一种利用增强日志的额外信息识别任务之间结构关系的挖掘算法,该算法简化了挖掘的步骤,且利用有色Petri网表示了所获过程模型的场景信息。(4)针对现有对齐计算过程中出现不同的活动标签,已有的对齐计算方法对不同的活动采用相同成本,在此提出了基于动态规划增强活动依赖的最优对齐计算方法,并用于前面生成的日志与过程挖掘所获模型的对齐计算,该方法能够在最优对齐的计算中差异化不同活动权重并在计算结果中体现(5)针对流程优化过程中出现的模型不准确及忽视数据流的问题,已有的流程优化方法大多仅从控制流结构进行优化,在此提出一种基于过程挖掘的并行优化算法,通过过程挖掘的加入解决流程模型过时问题,并考虑活动间数据交互进行并行结构优化,在一定程度上提高了实际优化结果的可行性。图[74]表[13]参[94]
其他文献
因果中介分析是通过中介变量识别解释自变量和因变量之间关系的因果机制。目前,中介分析的研究主要集中在自然直接与间接效应推断,很少进行效应的估计与分布的研究。本文分别在简单中介模型、具有混杂变量的中介模型、具有交互作用的中介模型和具有多个中介变量的中介模型下进行了自然直接与间接效应估计,并由Delta方法获得了估计量的分布。论文的主要工作包括以下四个部分。第一部分对单个中介变量情形,运用线性回归建立自
随着现代通信技术的发展,对相关元器件的需求也越来越大。这些年,微波介质陶瓷发展迅速,是因为由其制作的微波元器件,有不少优点,例如小巧、经济、质量轻、性能稳等,因此可以满足现代通信工具的小型化、集成化等要求。低温共烧陶瓷(LTCC:Low Temperature Co-fired Ceramic),是一种多层电路,由未烧结的流延陶瓷材料叠层在一起制成,内置印制互联导体、电路和元件,该结构被烧结成一个
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。
文本表示是自然语言研究的基础问题,也是帮助我们高效处理文本信息的关键,传统的文本表示模型大多是基于词或短语构建,普遍存在容易丢失语义信息的问题。近年来,事件这一概念引起了学者的高度重视,叙事类文本中包含了大量的事件,面向事件对文本表示模型进行研究,以事件或事件要素作为语义单元,可以很好的保留文本中存在的深层语义信息。本文首先对文本中缺省的对象要素、时间要素和地点要素进行缺省补全的研究;然后以事件作
互联网时代信息爆炸增长,搜索引擎已经无法满足用户的需求。推荐系统通过分析用户历史行为预测用户的偏好,可以实现主动的个性化推荐。但当前推荐算法中仍存在数据稀疏和冷启动等问题影响推荐系统的性能。社交网络中存在用户行为信息和用户社会关系,考虑将社交网络应用到推荐算法中,能有效改善上述问题。因此,本文首先提取社交网络中的用户行为信息特征,然后提出一种社交网络中的矩阵分解推荐算法,主要研究内容如下:1.针对
在微博话题讨论过程中,用户更加注重输入的简化、随性的表达以及情感的输出,便自发性的转变了自己的语言表述方式。这一转变直接增加了网络新词的输出,使得微博文本情感倾向分析更加困难。为了解决这个问题,本文提出了一种基于情感新词识别的微博文本情感分析的方法。首先通过统计量方法从微博数据中识别出新词;其次根据新词的上下文信息及其语义信息识别出情感新词,;最后扩展微博情感词库并结合多种规则进行微博文本情感倾向
研究目的:分析长链非编码RNA动脉粥样硬化斑块相关转录本(long noncoding RNA atherosclerosis plaque associated transcript,lncRNA-APAT)在无冠脉斑块患者、完全钙化斑块患者和混合斑块患者外周血中的表达差异,并阐明lncRNA-APAT通过竞争性结合microRNA-181a(miR-181a)对单核-巨噬细胞功能和动脉粥样硬化
鼻咽癌是我国华南地区高发的恶性肿瘤,早期症状不明显,易造成漏诊误诊。鼻咽癌诊断存在血清学标志物敏感度及特异度不高、影像学筛查费用昂贵、分辨率不高、病理活检侵入危害等限制。因此开发更多特异性生物标志物是亟待推进的问题。本研究目的是筛选一批与鼻咽癌发生发展相关的非编码RNA(non-coding RNA)和基因标志物,阐述它们相互之间的调控模式,为进一步研究鼻咽癌病理过程中的生物学功能提供新视角。以鼻
人口老龄化问题的加剧,使得老年人口占比越来越大,养老服务产业需要满足老人日益增长的需求。但是由于国内养老资源不足,养老服务体系不够完善,使得对老人,特别是独居老人的健康照护面临严峻的挑战。传感器技术和普适计算的发展能够让各种传感器佩戴在老人身上或者部署在老人的家中,从而通过老人的运动和日常活动及生理情况的变化产生大量的数据。同时,大数据处理和人工智能技术的发展为分析居家老人的各类数据、研究老人行为
过程感知信息系统在当代组织中变得无处不在,这些信息系统以事件日志的形式记录了大量的业务流程执行数据,而过程挖掘技术是从事件日志中抽取有用的过程知识,旨在发现、监测和增强现实的业务流程。过程挖掘技术的应用有利于提升公司生产率,在指导公司经营,节省运行成本等方面发挥着重要功效。因此,过程挖掘技术是业务流程管理中的关键技术。信息系统的不断完善使得业务流程中的数据能够被充分的发现和利用,也使得过程挖掘技术