论文部分内容阅读
近几十年来,数据库技术和海量存储器等硬件的快速发展使得人们收集数据的能力得到进一步的提高。面对信息时代海量数据的出现,如何有效地利用大量的原始数据分析现状以预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术应运而生并得以迅猛发展。目前,数据挖掘已经成为一个研究热点。数据挖掘所得到的知识能够为决策支持提供依据。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。本文根据关联规则挖掘的要求与特点,结合遗传算法的思想,提出了一个基于遗传算法的关联规则挖掘方法,并通过实例分析,说明是一种具有实用价值的方法。文中主要在以下几方面做了深入的研究:首先对数据挖掘进行了评述,阐明了什么是数据挖掘,为什么要数据挖掘、如何进行数据挖掘、数据挖掘与机器学习、统计学等相关学科的区别与联系、数据挖掘的主要过程、分类等问题。介绍了数据挖掘中的一个重要算法——遗传算法。文中对遗传算法的产生与发展、遗传算法的主要理论、遗传算法的特性以及遗传算法的广泛应用都进行了简要的介绍。深入地分析与研究了关联规则。对关联规则的衡量标准作了系统的研究,针对基于支持度和置信度框架模型的局限性,引入了基于多变量的提升度,用来修剪无趣的规则,从而筛选出用户真正感兴趣的规则模式。在此基础上,提出一种基于遗传算法的关联规则挖掘算法,从编码方法、适应度函数的构造、交叉算子和变异算子的设计等方面进行了详细的讨论和分析。结合商品销售系统,给出了遗传算法进行关联规则挖掘的实例。