论文部分内容阅读
针对Apriori算法在Hadoop平台下数据处理效率低的问题,提出一种矩阵优化的改进算法Apri⁃ori_MR。该算法采用了事务压缩矩阵,并对矩阵进行二次优化,减少3-阶及以上候选项目集以及缩短候选项目集产生预判时间,提高数据处理效率。将改进算法结合Hadoop框架进行并行化实现,证明了算法的有效性及并行性。