论文部分内容阅读
近年来,随着数据库技术的迅速发展,数据存量大量增加,数据挖掘技术变得越来越重要,从而引起了各个学术领域的研究人员的兴趣,数据挖掘旋即扩展到各个领域。关联规则挖掘是数据挖掘中最活跃的研究方法之一。数据挖掘作为一种用于从大规模数据集中提取潜在有用的信息和知识的技术,越来越得到广泛的研究和应用。而关联规则挖掘作为最初推动数据挖掘迅猛发展的一个重要因素,被广泛应用于大型零售组织的决策支持中,它为确定市场策略、提高决策支持能力提供了有力的技术和工具保证。本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了系统、深入、全面、详尽地分析和研究,主要包括以下一些内容:数据挖掘技术的分析与研究。对数据挖掘技术的国内外研究现状进行了广泛而全面地归纳、分析和研究,对数据挖掘的定义及功能进行了简要的回顾,对数据挖掘技术的未来发展趋势和热点研究领域进行了总结和探讨,在数据挖掘基本概念的基础上,对数据挖掘常使用的技术和研究的对象进行了详细地分类、归纳和总结。为本文的全面展开奠定了基础。关联规则数据挖掘技术的分析与研究。在介绍关联规则基本概念的基础上,对关联规则的Apriori算法进行了详细地分析和研究,并就目前针对提高该算法效率的各种优化技术也进行了详细地描述,在此基础上提出了两种改进的Apriori挖掘算法。一种基于无向项集图的动态频繁项集挖掘算法,当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次无向项集图即可得到新的频繁项集.该算法不仅简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间等优点。另一种基于垂直事务列表的树形结构的挖掘算法,该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。