基于日志数据仓库的工作流挖掘研究

来源 :东北电力大学 | 被引量 : 0次 | 上传用户:po689322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前工作流技术已经成为计算机应用领域的研究热点。但是在传统的工作流生命周期中存在着一定问题,建立的过程模型往往不能与实际过程完全相符,为了更好的对工作流过程进行历史追踪分析,研究者提出了工作流挖掘技术。 本文首先介绍了工作流技术得发展情况,接着根据传统的工作流生命开发周期存在的问题引出工作流挖掘技术,并对工作流挖掘的目标和具体作用做了详细得阐述。由于工作流挖掘的起点就是收集和处理工作流日志,本文对工作流日志的定义和移动无线广告业务的工作流日志作了详细介绍。由于一般企业业务流程复杂,所存的工作流日志量非常大。本文采用将海量工作流日志存储到数据仓库的方法,根据相应的事实表和维表采用星形模型建立了日志数据仓库。并对数据提取清洗集成以实现数据更新,针对突发性事件采取主动更新策略,这样既能及时更新数据又提高了效率。 目前已提出了很多工作流挖掘算法,但是大多都具有一定的局限性。本文对工作流挖掘中的隐含问题做了进一步分析,并具体研究了在工作流挖掘中存在的隐含库所和隐含迁移的问题。针对α算法挖掘隐含任务的局限性,提出了一种改进的挖掘算法-α+*术算法。本文利用Petri网仿真工具CPNTools将工作流日志进行图形化仿真,并在工作流挖掘工具ProM中开发出插件对α+*算法进行了运行验证,分别通过人工日志和实际日志进行验证,结果表明α+*算法确实能正确的挖掘出隐含任务。并且将α+*算法和α算法通过适应度和合适度进行了对比,进一步得出了α+*算法对隐含任务的挖掘的有效性。 在文章最后对研究中存在的不足做了分析,并展望了工作流挖掘领域的发展前景。
其他文献
下一代网络是业务驱动的网络,开放业务接口将电信业务的开发开放给了第三方,这有利于促进业务的繁荣。简单、统一的业务提供接口和方式可以实现业务的快速开发和统一处理。现
医学成像已经成为现代医疗不可或缺的一部分,用不同的成像设备所得到的医学图像信息常常具有互补性,为了综合使用多种医学成像模式以提供更全面的信息,常常需要将有效信息进行整
随着IT技术的不断发展,Intranet/Internet技术得到广泛应用,计算机数目不断增加。对于网络管理人员来说,管理和维护局域网大量的计算机越来越困难。因此如何开发既能准确定位出
空间数据库是近年的热点研究领域,它在地理信息系统(GIS),计算机辅助设计与制造(CAD/CAM),多媒体系统以及数字地球方面都有着广泛的应用。空间数据近邻查询作为空间数据库在
公共资源在我们的日常生活中是随处可见的。所谓公共资源,是指可以被公众或者特定的团体成员使用的某个或者某类资源。由于资源的使用权不确定,由此便带来一系列的问题。对于
网络运行维护是电信运营商主要的生产与管理工作职能之一,是保障运营商的网络与业务正常、安全、有效运行的不可或缺的重要部分。运维系统建设和运行的好坏直接影响到电信运
由于互联网的高速发展以及搜索引擎的技术限制,目前搜索引擎的查询信息很难覆盖到整个网络。有调查表明,现有搜索引擎所返回的查询结果往往不符合用户的查询需求。如何真正以用
在计算机游戏中,玩家与游戏对象的交互是通过手动编写脚本程序实现。计算机游戏具有复杂且有深度的故事情节,因此游戏的脚本程序实现起来很复杂。通常游戏故事的作者是无法完
近年来,随着电子技术、无线通信技术和嵌入式技术的快速发展,造价低、功耗低和功能多样的传感节点应运而生,无线传感网络技术在环境监测、工业、医疗等领域越来越受到广泛的
随着Internet的迅速发展,人们面对太多的信息无法选择和消化,淹没在繁杂的信息中,这种现象称为信息过载。Internet上信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,用