论文部分内容阅读
本文对数据挖掘技术尤其是关联规则挖掘技术进行了系统、深入地分析和研究,并将其投入到实际应用中。主要包括以下一些内容:首先对数据挖掘技术进行了简要的回顾,在提出数据挖掘基本概念的基础上,对数据挖掘可发现的模式进行了详细地分类、归纳和总结。对数据挖掘的体系框架及运行过程也作了详细的探讨。对数据挖掘技术的国内外研究现状和当前的研究热点进行了归纳和总结。为本文的全面展开奠定了基础。然后重点讨论了关联规则挖掘算法。在提出关联规则基本概念的基础上,对关联规则的典型挖掘算法—Apriori算法及其基本思想进行了详细的分析和研究。针对提高算法效率的各种优化技术也进行了研究和讨论。为改进算法的提出和构造建立了理论上的必要性前提。客观地分析了现有几种算法的优缺点。针对于经典频繁项集挖掘算法的不足,重点探讨了基于聚类的关联规则改进算法和基于权值的关联规则挖掘算法。基于聚类的关联规则改进算法的目的是提高算法效率,在预处理阶段先将数据聚类,缩小数据集,对关联规则挖掘算法改进后,再进行挖掘。基于权值的关联规则挖掘算法的目的是提高挖掘结果的合理性,针对于各数据项的不同地位或重要性,利用一线性函数对各数据项设置权值,然后再进行关联规则挖掘。