论文部分内容阅读
在关联规则挖掘算法中,PredictiveApriori算法只需设定输出最好的N个规则,就可挖掘出N个预测精度最大的规则,从而极大地减轻用户参数设置的负担.但该算法需要不断对事务数据库进行扫描,如果事务数据库很大将会大大增加I/O时间,降低挖掘效率.本文融合事务压缩技术,提出一种称为FastPredictiveApriori的改进版算法.实验结果表明,随着事务数据量的增大,改进后的算法只需扫描压缩事务集.因此,在事务数据库很大时,该算法能明显提高执行效率.