论文部分内容阅读
本文以序列模式的数据库为切入点,在对具有序列特征的数据进行预处理的基础上,重点对序列模式数据挖掘算法进行了深入研究,以期通过较为有效的方法对解决挖掘序列形式的知识的问题提供一条可选的路径。
本文首先阐述了数据挖掘的基本概念、关联规则的有关知识,提出了在序列模式的数据库上对数据进行预处理的方法及步骤,研究了变化率的求取、基本预处理工作、特殊预处理工作和数据离散化等问题。在此基础上,重点研究了传统的序列模式挖掘算法和基于项目位置索引的序列模式挖掘算法,并对算法进行了理论比较,说明基于项目位置索引的序列模式挖掘算法比Apriori算法降低了算法复杂度,提高了效率,并具有更好的可扩展性。