论文部分内容阅读
分类是一种重要的数据分析手段,它在数据挖掘和人工智能等领域都得到了广泛地应用。人们对数据分类问题进行了深入的研究,产生了多种分类算法,如:决策树分类算法、贝叶斯分类算法等等。由于在现实生活中很多问题都可以转化为分类问题,因此对于分类算法的研究具有很重要的现实意义。蚂蚁是一种群居昆虫,虽然其个体的行为简单,但其整体能完成复杂的、个体无法完成的任务,表现出了高度的自组织性。受其觅食行为的启发,20世纪90年代意大利学者M.Dorig。等人提出了一种新型的模拟进化算法——蚁群算法。自该算法提出以来引起了许多国內外研究者的关注,其应用领域得到了迅速拓宽,在硬件实现上也取得了突破性进展,同时在蚁群算法的模型改进及与其他仿生优化算法的结合方面展现出了前所未有的勃勃生机。虽然,人们对数据分类方法和蚁群算法的研究都很多,但是对于将蚁群算法应用在解决数据分类问题方面的研究并不多。2002年英国学者Parepinelli和他的同事们将蚁群算法首次应用于数据分类领域,提出了一种解决分类问题的蚁群算法——Ant-Miner算法,该算法是最早的基于蚁群算法的分类模型。由于Ant-Minet算法具有很好的健壮性、鲁棒性等特点,在解决大规模的数据分类问题时表现出了很大的潜力,取得了较好的成果。随后,很多学者在此基础上对Ant-Miner算法进行了不断的改进。国内主要有暨南大学的刘波教授等人提出了Ant-Miner2和Ant-Miner3算法,西安交通大学王自强等人提出的ACO-Minet算法等;国外主要有英国学者JamesSmaldon等人提出的Unordered Rule Set Ant-Miner算法等。本文系统地研究了数据分类算法、蚁群算法以及Ant-Minet算法(基于蚁群算法的第一个分类模型),并在分析原Ant-Miner算法的基础上进行了以下两方面的改进:(1)为了避免算法过早收敛于局部最优解,提出了具有免疫特征的Ant-Miner算法。该算法在原Ant-Miner算法中引入了克隆选择算子、亲和突变算子及免疫选择算子,从而提高了算法对解的搜索能力。实验结果表明,改进后的算法在算法精度方面较原算法有明显的提高。(2)针对原条件选择策略中存在的一些缺点,提出了一种新的条件选择策略——双条件选择策略,也就是在选择条件时不仅考虑原始算法中所考虑的条件转移概率函数值,而且还需要进一步比较待选择被加入到规则中的条件所覆盖的样本的个数,从而保证了加入到规则中的条件的最优性。将该条件选择策略应用于原Ant-Miner算法中,得到了基于双条件选择策略的Ant-Miner算法。实验结果证明,改进后的算法不仅在分类精度方面优于原算法,而且程序运行时间也明显少于原算法。