论文部分内容阅读
随着人们对时态数据挖掘的深入,周期挖掘作为理解时态数据、预测未来趋势的一个极有意义的特征,日益成为时态数据挖掘中十分重要的研究课题。然而,目前很少有人研究基于多属性特征时态数据的近似周期,即多维时态近似周期。多维近似周期指的是多属性事件发生后,相隔一个时间周期(该时间周期可以在固定时间K的时间范围δ内波动)多属性事件重复发生,其关联规则还同时研究了该近似周期规则前件对规则后件发生的影响程度。这是一个很有意义的研究方向,因为同一对象多个属性之间往往存在周期性的相互影响,多个对象的属性之间由于对象的相互竞争、合作关系,也存在周期性的影响,而这种周期性往往表现为近似周期。如果我们将其应用到金融、气象、水文、医疗、超市等领域,发现其近似周期与关联规则,对指导和管理相关的决策问题具有相当的实际价值。本文从以下几方面对时态近似周期进行了研究:(1)介绍了时态周期挖掘的研究背景和不足,引出本文研究内容。(2)在时态型、时态因子和时间粒度的基础上,给出了多维时态事件与预测模型,以及多维时态周期关联规则模型。(3)提出了多维时态近似周期的数学定义,如多维近似周期模式、近似周期模式的支持度、置信度、近似精度和模式覆盖等,证明了相关性质。同时研究了基于时态数据库的层次聚类和SOM聚类的多维时态近似周期的挖掘算法,实验表明了算法的有效性。(4)扩展了多维时态近似周期的定义和性质,提出了三种多维时态近似周期关联规则的概念和性质,研究了基于SQL语言和SOM聚类的挖掘算法并进行了实验,同时尝试将近似周期关联规则应用于关联规则后件预测。本文获得的主要成果为:1、给出了多维时态事件,扩展了多维时态预测模型,提出了多维周期关联规则模型,并证明了相关性质。2、提出了一种多维时态近似周期的数学模型,给出了基于时态数据库的层次聚类和SOM聚类的挖掘算法。3、对三种不同类型多维时态近似周期关联规则进行探讨,提出基于时态数据库和SOM聚类的挖掘算法并应用于实践预测。