论文部分内容阅读
数据库内容非常丰富,其中蕴藏着大量的信息,而分类是一种数据分析的形式,分类分析已经成为数据挖掘技术中重要而且热门的研究领域之一,其目标就是根据已有的数据分类归纳出每类的一般性的描述。2002年Rafael S.Parpinelli在他的文章[1]中首次提出了基于蚁群优化(Ant Colony Optimization)的分类算法----蚂蚁矿工算法(Ant-miner)。他的这篇论文开辟了蚁群算法应用的一个新领域,同时也开创了分类算法的一个新的里程碑。然而Ant-miner算法存在着早熟与陷入局部最优的缺陷,针对这些缺陷本文在Ant-miner算法的基础上提出了基于并行蚁群优化的分类算法IMACO (Interacted Multiple Ant Colonies Optimization),新算法在原算法的基础上做了以下三点改进:1)采用多重信息素,每一种信息素都只允许构建一个类别,蚂蚁先选择分类类别,然后释放相应的信息素。2)对状态转移规则的改进:引入伪随机概率转移规则,替换Ant-miner算法中的随机概率转移规则。3)引入相关度的概念来衡量规则的分布均匀程度,从而达到动态调整路径选择策略的目的。实验结果表明,改进后的新算法不仅在分类预测精度上要高于原算法而且得到的分类规则也比原算法简单。文章最后使用UCI标准数据库中的四个数据对该算法进行了检验,实验结果表明该算法与原算法相比在分类的准确度上有一定提高,所得到的分类规则也更简洁。