论文部分内容阅读
针对Apriori算法效率不高的问题,提出一种基于频繁模式矩阵的方法来挖掘最大频繁项目集。算法的基本思想是:只需扫描原始事务数据集一次,将事务数据转换成压缩矩阵,矩阵中保留了项目间的关联信息,同时只存放逻辑型数据,数据挖掘只采用逻辑运算,在挖掘过程中根据条件不断的对事务数据集和候选集进行剪枝,减少了不必要的开销。当数据量较大时,在效率上有一定的优势。实验结果表明改进后的算法具有良好的性能,提高了挖掘的速度。