论文部分内容阅读
数据挖掘技术是当今的研究热点,已在诸如商务、医学与工程学等众多领域拥有广泛应用。它能够探查隐藏在数据间的有用信息,帮助分析决策。关联分析作为数据挖掘技术中极其重要的一环,研究成果相对较多。关联分析的主要功能是探查数据集中数据之间的关联,并用关联规则或者频繁项集来表示它们。本文首先对关联规则挖掘算法中的经典算法Apriori算法、FP-增长算法以及FUP算法分别加以介绍。然后对于关联规则增量式更新这一问题提出了一种基于改进FP-树的关联规则增量式更新算法FPmineUA。该算法基于一种不生成条件FP-树的改进FP-树,并将其与增量式更新算法相结合,在对FP-树进行优化的基础上,改进了传统增量式更新算法产生巨大候选项集以及频繁扫描数据库的性能缺陷,提高了时间以及空间的效率。实验表明,随着支持度的降低,FPmineUA算法相比传统增量式更新算法在性能上有一定提升。