论文部分内容阅读
为了提高带负项值的on-shelf效用项集挖掘算法的挖掘效率,提出带负项值的on-shelf效用项集并行挖掘算法DTP-Houn,算法基于MapReduce框架,充分利用其on-shelf时间段因素,将原始事务数据库按照时间段进行分片。算法将挖掘过程转化为MapReduce工作,Map阶段在分片数据库中挖掘候选项集,Reduce阶段并行计算候选项集的on-shelf效用值。实验结果表明,算法取得了较高的挖掘效率。