论文部分内容阅读
为提高挖掘频繁项集的效率,在垂直数据格式下,结合分治思想提出一种基于分治策略与位运算频繁项集挖掘算法DC一FIMBII.利用分治将数据库中的事务划分为多个非重叠部分,对每一部分采用位运算求交计算支持度,从而减少操作时项集的规模和项集的比较次数.在mushroom、pumsb_star和T40I10D100K 等数据集上,对DCGFIMBII、Apriori、Eclat、DFGFIMBII等算法进行比较.实验表明,DCGFIMBII具有更高的效率.