基于蚁群算法的数据分类方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:ycy111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是一种重要的数据分析手段,它在数据挖掘和人工智能等领域都得到了广泛地应用。人们对数据分类问题进行了深入的研究,产生了多种分类算法,如:决策树分类算法、贝叶斯分类算法等等。由于在现实生活中很多问题都可以转化为分类问题,因此对于分类算法的研究具有很重要的现实意义。蚂蚁是一种群居昆虫,虽然其个体的行为简单,但其整体能完成复杂的、个体无法完成的任务,表现出了高度的自组织性。受其觅食行为的启发,20世纪90年代意大利学者M.Dorig。等人提出了一种新型的模拟进化算法——蚁群算法。自该算法提出以来引起了许多国內外研究者的关注,其应用领域得到了迅速拓宽,在硬件实现上也取得了突破性进展,同时在蚁群算法的模型改进及与其他仿生优化算法的结合方面展现出了前所未有的勃勃生机。虽然,人们对数据分类方法和蚁群算法的研究都很多,但是对于将蚁群算法应用在解决数据分类问题方面的研究并不多。2002年英国学者Parepinelli和他的同事们将蚁群算法首次应用于数据分类领域,提出了一种解决分类问题的蚁群算法——Ant-Miner算法,该算法是最早的基于蚁群算法的分类模型。由于Ant-Minet算法具有很好的健壮性、鲁棒性等特点,在解决大规模的数据分类问题时表现出了很大的潜力,取得了较好的成果。随后,很多学者在此基础上对Ant-Miner算法进行了不断的改进。国内主要有暨南大学的刘波教授等人提出了Ant-Miner2和Ant-Miner3算法,西安交通大学王自强等人提出的ACO-Minet算法等;国外主要有英国学者JamesSmaldon等人提出的Unordered Rule Set Ant-Miner算法等。本文系统地研究了数据分类算法、蚁群算法以及Ant-Minet算法(基于蚁群算法的第一个分类模型),并在分析原Ant-Miner算法的基础上进行了以下两方面的改进:(1)为了避免算法过早收敛于局部最优解,提出了具有免疫特征的Ant-Miner算法。该算法在原Ant-Miner算法中引入了克隆选择算子、亲和突变算子及免疫选择算子,从而提高了算法对解的搜索能力。实验结果表明,改进后的算法在算法精度方面较原算法有明显的提高。(2)针对原条件选择策略中存在的一些缺点,提出了一种新的条件选择策略——双条件选择策略,也就是在选择条件时不仅考虑原始算法中所考虑的条件转移概率函数值,而且还需要进一步比较待选择被加入到规则中的条件所覆盖的样本的个数,从而保证了加入到规则中的条件的最优性。将该条件选择策略应用于原Ant-Miner算法中,得到了基于双条件选择策略的Ant-Miner算法。实验结果证明,改进后的算法不仅在分类精度方面优于原算法,而且程序运行时间也明显少于原算法。
其他文献
标准表法检定特大口径电磁流量计的方法具有其它流量标准装置所不具备的优点,它可以有效地节约能源消耗,提高特大口径电磁流量计的检定准确度.该文通过一系列的理论分析和试
流程行业综合自动化系统(CIPS)是一个与周围环境有物质、能源、信息交换的开放型、大规模、多层次、多模式、多视图的复杂系统.任何单个领域或单元技术的理论方法都无法概括C
发酵过程是一个复杂的过程,在三个水平上进行,即菌体遗传特性的分子水平;细胞代谢特性的细胞水平;质量、热量、动量传递特性的工程水平。三个水平的问题互为因果,一旦某一个
作为国家经贸委项目"划糊控制器芯片的开发"的一部分,工作人员开发了这个模糊控制智能开发系统.作为一个总结,该文主要介绍在开发系统中实现的两种模糊规则提取方法,分别是基
论文的导论首先回顾了城市大气污染的发展历史,提出环境的可持续发展是社会和经济可持续发展的前提;第二章"城市交通污染及控制战略回顾"对国内外相关的交通污染控制战略和污
由于信息通道的带宽有限,网络控制系统(NCS)在实际应用中不可避免地会发生网络拥塞、诱导时滞以及随机丢包等问题。针对丢包问题的处理方法很多,建立的数学模型也不尽相同。
复杂机械系统状态监测是系统故障诊断的重要前提,近年来,针对复杂机械系统状态监测,国内外学者研究了多种状态监测方法,解决了机械工程领域的部分问题,但这些方法存在各自的适用范围。本文在拓扑学和拓扑反变原理基础上,对复杂机械系统状态监测的拓扑反变方法进行了研究,具体的内容包括:首先,本文在拓扑学、拓扑反变原理的基础上,构建了复杂机械系统的原始信息空间和目标信息空间,通过相应的拓扑反变定义、定理证明了目标
随着科学技术的进步,现代社会日趋信息化、系统化,在工业生产、社会经济和生态生物等领域出现了许多复杂的关联大系统。目前,传统的控制方法难以解决复杂非线性大系统的分析
该文对随机系统的指数稳定性与神经网络的定性分析进行了深入的研究.全文由"导论"、"随机系统的指数稳定性"、"神经网络的定性分析"、"总结和展望"四部分组成."导论"部分由第