论文部分内容阅读
目前工作流技术已经成为计算机应用领域的研究热点。但是在传统的工作流生命周期中存在着一定问题,建立的过程模型往往不能与实际过程完全相符,为了更好的对工作流过程进行历史追踪分析,研究者提出了工作流挖掘技术。
本文首先介绍了工作流技术得发展情况,接着根据传统的工作流生命开发周期存在的问题引出工作流挖掘技术,并对工作流挖掘的目标和具体作用做了详细得阐述。由于工作流挖掘的起点就是收集和处理工作流日志,本文对工作流日志的定义和移动无线广告业务的工作流日志作了详细介绍。由于一般企业业务流程复杂,所存的工作流日志量非常大。本文采用将海量工作流日志存储到数据仓库的方法,根据相应的事实表和维表采用星形模型建立了日志数据仓库。并对数据提取清洗集成以实现数据更新,针对突发性事件采取主动更新策略,这样既能及时更新数据又提高了效率。
目前已提出了很多工作流挖掘算法,但是大多都具有一定的局限性。本文对工作流挖掘中的隐含问题做了进一步分析,并具体研究了在工作流挖掘中存在的隐含库所和隐含迁移的问题。针对α算法挖掘隐含任务的局限性,提出了一种改进的挖掘算法-α+*术算法。本文利用Petri网仿真工具CPNTools将工作流日志进行图形化仿真,并在工作流挖掘工具ProM中开发出插件对α+*算法进行了运行验证,分别通过人工日志和实际日志进行验证,结果表明α+*算法确实能正确的挖掘出隐含任务。并且将α+*算法和α算法通过适应度和合适度进行了对比,进一步得出了α+*算法对隐含任务的挖掘的有效性。
在文章最后对研究中存在的不足做了分析,并展望了工作流挖掘领域的发展前景。