论文部分内容阅读
发现关联规则是数据挖掘技术的重要任务之一.之前提出的绝大多数算法需要多次遍历数据库才能产生频繁项集,造成巨大的CPU和内存开销.根据网上交易数据海量的特点,提出了一种基于频繁模式增长(FP-growth)的并行算法.该算法可以在不产生候选集的基础上并行的挖掘海量数据.试验证明该算法可以缓解了项目数量巨大而内存不足的矛盾,减少了算法的执行时间.利用该算法对网上交易进行关联规则挖掘,发现了有价值的决策支持信息.