论文部分内容阅读
频繁项集的精简表示是数据挖掘领域中一个研究热点,非可推导项集模型利用了容斥原理压缩频繁项集的数量。传统的挖掘算法在挖掘的过程中,存在多次扫描数据库、重复生成候选项集等效率低下的问题。文章提出一种新的算法MNDIBFP,该算法利用利用FP树压缩数据库,同时结合一定的剪枝策略,达到快速挖掘非可推导项集的目的。实验效果证明,该算法在时间消耗和空间消耗均优于传统算法。