论文部分内容阅读
关联规则的数据挖掘是数据挖掘技术中非常重要和有应用前景的一种技术,一直是近几年来数据挖掘研究和应用领域活跃的前沿。关联规则发现的主要研究方向是算法的优化和扩展应用领域。典型的关联规则发现算法是由R.Agrawal等提出的Apriori算法,其核心技术为其它各类关联规则采掘算法所广泛采用。但是,在计算侯选集的支持度时,Apriori算法是在每一个循环中都要扫描整个数据库,使得挖掘效率较低。本文针对Apriori算法存在的问题,提出了两种改进算法:基于三次遍历的快速关联规则挖掘算法和基于步长调节的关联规则挖掘算法,并通过与Apriori算法从扫描数据库的次数、时间复杂度和空间复杂度三方面进行比较,最后得出了这两种算法的效率高于Apriori算法结论。