论文部分内容阅读
借鉴FP_growth算法中频繁模式树的思想,提出包含正负项目的频繁模式树的构造方法.通过对该频繁模式树进行模式扩展,可以挖掘出包含正负项目的频繁项集.该算法与直接使用FP_growth算法挖掘含负项目的频繁项集相比,无需对原始数据库进行负项目的扩展,也不用再构造并销毁额外的数据结构,只需在原始的频繁模式树上修改,在时间和空间的开销上都具有一定优势.实验表明,本文算法比现有的同类挖掘算法和直接FP_growth算法具有更好的效率.