论文部分内容阅读
为了解决并行关联规则挖掘各节点间通信量巨大以及全局频繁项集难以准确、快速得到等问题,提出了一种新的基于客户机/服务器模式的并行关联规则挖掘算法。该算法中,各客户机只需要和服务器之间传递少量的信息,而无需和其它客户机通信,降低了通信成本;服务器端利用了数据库的触发器机制,使全局频繁项集得到的过程能够自动快速实现。实验结果表明了改进后算法的有效性,该算法可以使大数据集的挖掘从不可行到可行,从困难到容易。