论文部分内容阅读
蚁群算法作为计算智能研究的一个崭新分支,已在数据挖掘、机器学习、自动控制、故障诊断等诸多领域显示出强大的信息处理和问题求解能力以及广阔的研究前景。将人工蚁群算法与遗传算法相结合后而形成的蚁群遗传算法的研究和应用已经成为蚁群算法研究领域中极为重要且最活跃的研究方向,蚁群遗传算法在多方面都表现出比遗传算法更为优越的性能。
分类分析作为数据挖掘中一个重要任务,长期以来都是数据挖掘研究领域中一个较活跃的研究方向。大量的研究者都致力于通过各种方法构造高准确率的、高用户兴趣度的分类器。
阐述了蚁群算法及数据挖掘的研究发展现状,自然蚁群系统和蚁群算法的基本原理和研究内容,详细阐明了蚁群算法的理论基础、基本算子、算法流程及算法性能。在简要阐述遗传算法的基础上,详细阐述了蚁群遗传算法的基础理论、算法流程、基本算子和特点。在这些理论基础之上,结合数据挖掘分类分析的任务,对TSP问题和数据分类的规则提取过程进行了对比研究,并利用TSP问题模型来建立数据分类的数学模型,提出了一种基于蚁群遗传算法的分类算法(CBACGA)对模型进行处理。详细研究了该算法的主要原理、基础理论及流程;研究分析了该分类算法的人工蚂蚁染色体的编码策略、规则记忆池的产生及更新方法、规则适应度的计算方法、启发函数和信息素更新参数的设计、人工蚂蚁遗传操作中人工蚂蚁染色体的选择策略、交叉和变异等算子,分析了算法的计算复杂度。本文在Weka数据挖掘平台上利用JaVa语言实现了CBACGA算法,并采用多个UCI数据集使用本文所介绍的分类评价标准对ID3、C4.5、遗传算法分类器和CBACGA的分类结果进行比较,得出结论:CBACGA算法分类准确率高,鲁棒性强,在高噪声数据情况下仍然有较高的分类准确率。并且还通过实验对参数的不同组合对CBACGA分类算法效率的影响进行了探讨,得出结论:人工蚂蚁数量和人工蚂蚁进化代数对算法执行的效率存在一定的影响,但结果反映的情况与CBACGA理论的分析相吻合。
最后结合某省的公路养路费征管系统,提出一个基于J2EE的数据挖掘体系结构,并应用本文提出的CBACGA算法,给出了一个实例,得到了理想的结果,进一步验证了CBACGA较好的分类预测能力。