论文部分内容阅读
随着国民经济的持续增长,旅游行业得到了迅猛发展。旅游业在发展过程中突发事件时有发生,给人们的带来了生命和物质财产损失。现阶段对旅游突发事件的研究还很少,积累的旅游突发事件数据没有得到充分利用。论文以国家自然科学基金(60773112):旅游突发事件信息模式分析与预测研究、北京市自然科学基金项目(4082021):旅游突发事件的数据挖掘与智能预测研究为科研任务,将数据挖掘与旅游突发事件相结合,通过对关联规则挖掘算法的研究,获取隐藏在旅游突发事件数据中的有用信息。论文完成的主要工作如下:(1)对旅游突发事件进行了数据预处理,抽取旅游突发事件的属性项,对多种事件属性进行了数据清理、数据集成与变换,从而得到了能够用于数据挖掘的可用数据集。(2)提出了基于频繁模式树的属性项等价类的概念,并建立了等价类来挖掘频繁模式树中的频繁模式集。对频繁模式树等价类改进算法(FPE-tree)与未改进的频繁模式树算法进行了性能比较,结果表明频繁模式树等价类改进算法具有明显的高效性。(3)提出了一种新的基于等价类的关联规则的挖掘算法(FPBE),对算法进行了详细地阐述,并对算法的时间复杂度和空间复杂度进行了定性分析。将基于等价类的关联规则挖掘算法应用到旅游突发事件中。通过挖掘得到了隐藏在旅游突发事件数据集中的关联规则,验证了算法的可行性。将FPBE算法与频繁模式树挖掘算法和FPE-tree挖掘算法进行了比较,实验结果表明了FPBE算法的高效性。论文在以往的研究基础上对传统的频繁模式树算法进行了改进,提出了新的关联规则挖掘算法,并将算法应用于旅游突发事件中。论文的研究成果将有助于关联规则挖掘应用的推广,获取的旅游突发事件关联规则可为旅游突发事件预测预警系统的建立提供支持。