工作流成批处理方面的增量式挖掘算法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:DirtySnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工作流成批处理,是指将同一类型活动的多个工作流活动实例进行整合处理,使得原本多个工作流活动实例的分别执行变成组合执行,从而降低活动执行成本和提高活动执行效率。然而,由于企业业务过程及应用的复杂性与动态变化性,因此全面地把握与理解工作流成批处理的方式与定义工作流过程捕获一样存在困难。工作流挖掘是工作流技术在引进数据挖掘技术后形成的一个新的研究分支,旨在从描述了工作流实际执行情况的工作流日志中自动发现关于工作流过程的客观知识。而工作流成批处理方面的挖掘与工作流挖掘一样具有重要理论意义与实际应用价值。因此,本文对工作流成批处理方面的增量挖掘算法展开了研究,主要的研究工作如下:1)针对现有工作流成批处理方面挖掘研究未考虑工作流日志中的“脏数据”会影响挖掘结果的准确性问题,本文利用条件函数依赖来对增量工作流日志数据进行清洗,在条件函数依赖发现算法CFINDER的基础上,借鉴增量思想,提出了增量挖掘条件函数依赖算法CFUP。该算法的主要思想是利用上一次挖掘结果,减少对原始数据集的扫描,从而减少运行时间,提高算法效率。理论分析和实验结果验证了CFUP算法的可行性和有效性,表明CFUP算法的执行效率优于CFINDER算法。2)针对现有成批处理依赖挖掘算法未考虑工作流日志数据的增量更新问题,本文在成批处理依赖挖掘算法Mine_BD的基础上,借鉴增量思想,提出了增量挖掘成批处理依赖算法Inc_Mine_BD。Inc_Mine_BD算法在增量更新的工作流日志数据上,能有效检测出原有的成批处理依赖是否失效以及是否出现新的成批处理依赖。理论分析和实验结果验证了Inc_Mine_BD算法的可行性和有效性。3)为有效评价数据清洗对工作流成批处理方面挖掘的影响,本文将CFUP算法与Mine_BD算法相结合,首先利用CFUP算法获得的条件函数依赖对待挖掘的工作流日志数据进行清洗,然后应用Mine_BD算法分别对清洗前和清洗后的工作流日志数据进行挖掘,最后通过比对两者的挖掘结果验证CFUP算法对提高工作流成批处理方面挖掘质量的有效性。
其他文献
有限元法是一种常用的离散化的计算方法,被广泛地应用于微分方程描述的场问题的求解。四面体网格是常用的有限元之一,但现有的四面体网格生成算法不可避免地生成形状不佳的网格
随着网络技术的蓬勃发展,越来越多以图像和视频为主的多媒体信息在网络上传输,不断影响着我们的日常生活,使得沟通越来越便捷,但同时也存在一些信息泄露的安全隐患。如何通过
随着互联网的高速发展,互联网上的信息数据呈现着爆炸性增长,这也相应地推动了语义网的发展,导致不同领域中用来描述知识的本体规模也越来越庞大,出现了大本体。大本体分块映
嵌入式系统近年来在取得了高速的发展的同时也开始逐渐被软件性能问题和硬件的功耗问题所困扰。本文就嵌入式处理器中的性能计数器在解决当前嵌入式系统发展中遇到的两方面的
随着计算机处理分析图像能力的日益提高,利用计算机跟踪和分析群体的行为已经成为计算机视觉研究领域的一个热点。群体运动的分割和人群的异常行为检测是群体运动分析的首要步
Web服务技术是面向服务体系架构的一种实现方式。随着服务的提供者日渐增多,部署在分布、开放、多变、难控的网络环境下的Web服务,保证其能够正确、安全和有效的为用户提供服务
神经网络集成是以多个人工神经网络同时对同一个问题进行学习,其集成的结果由参与集成的各个神经网络在同一输入示例的输入条件下的输出进行组合而成的,即输出由构成这个集成的
随着物联网技术的出现及不断发展,作为物联网感知层关键技术之一的无线传感器网络技术也受到越来越多的关注。无线传感器网络在灵活性、容错性、低功耗及快速部署方面具有特
微博拥有信息多元、表达快捷、互动性强等传统媒体无法比拟的优势,迅速发展为人际交互及信息传播的主要方式,在商品营销、舆情传播等方面有着广泛的应用。影响力的问题被引入到
摘要:经典智能规划问题是人工智能研究领域里最为重要的问题之一。但是由于其时间复杂度上的不可跟踪性,使得这项技术在实际应用中的范围十分受限,所以一直以来,与智能规划有