论文部分内容阅读
首先,深入分析了频繁模式挖掘算法Eclat和Eclat+,在大数据集上挖掘长模式时,Eclat+的性能不及Eclat。基于此,提出一种改进的Eclat算法,新算法充分利用了垂直数据表示和交叉计数的高效优势,直接在垂直数据表示的数据集上通过广度优先搜索和交叉计数产生频繁模式。实验结果表明,在挖掘长模式时,改进的Eclat算法的运行速度较Eclat、Eclat+均有明显的提高。