论文部分内容阅读
FP—Growth算法的效率约比Apriori快一个数量级,但存在FP-tree可能过大和串行处理等两大缺点,为此提出了基于局部FP—tree的并行关联规则挖掘算法P—FP—Growth。为实现基于云计算的并行关联规则挖掘,用MapReduce计算模型描述了P—FP—Growth算法,在Hadoop下进行了编程实现,得出了频繁模式挖掘结果,验证了该算法在云计算平台进行部署和执行的可行性。对比了算法分别在局域网多节点并行处理和在Hadoop平台执行的所需时间。