蚁群算法在分类规则挖掘中的应用研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:w4444w4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪90年代初,意大利学者M.Darigo等人受蚂蚁在觅食过程中可以找出从巢穴到食物源的最短路径的启发,提出了蚁群算法(ant colony algorithm )。蚁群算法是一种新型的模拟进化算法,具有本质并行、正反馈及协同性等优点,在解决复杂优化问题上显示出了良好的适应性。用该方法求解TSP问题、分配问题、Job-shop调度问题,都取得了较好的实验结果。虽然研究时间不长,但是现有的研究显示出,蚁群算法在求解复杂优化问题方面有一定的优势,是一种有发展前景的算法。 分类规则挖掘是数据挖掘最重要的研究领域之一。分类是对大量有关数据进行分析、学习,并建立相应问题领域中的分类模型的过程,其主要目标是将待分类对象(或模式)归入到特定的类别中。分类规则的挖掘在机器学习、数据挖掘等领域已经得到广泛研究,在医疗诊断、天气预报、市场分析、风险预测等许多领域具有很好的研究和应用前景。 分类操作一般分为以下两个步骤: 第一步是分类器的构造,即建立模型用来描述数据集合和概念集合。在这一阶段需要有一个训练样本数据集(简称训练集)作为输入。训练集是由一条条纪录组成的。每条记录包含若干个属性,组成一个特征向量。在所有属性中有且仅有一个属性作为类别属性。通过分析由这些属性描述的数据库元组来构造分类模型。 第二步是利用模型进行分类。具体来说就是使用第一步训练完成的分类模型来预测数据的类别,或利用该模型对数据集中的每一类别进行描述,形成分类规则。 蚁群算法作为一种新型的模拟进化算法,其在数据挖掘中的应用正逐步引起人们的注意。本文主要研究了蚁群算法,并将蚁群算法应用到数据挖掘中的分类规则挖掘当中,对蚁群算法在分类规则挖掘中的应用做了相关研究,具有一定的理论及现实意义。本文主要内容包括: 1、首先介绍了蚁群算法基本原理及蚁群系统模型,对蚁群算法中相关参数进行了研究, 然后给出了几种改进的蚁群算法,其中包括本人对蚁群算法的一种改进—基于信息素扩散的自适应进化蚁群算法。接着介绍了分类规则挖掘相关知识。包括分类规则挖掘概述,数据的预处理,分类方法的评价标准,几种典型的分类算法及其特性。 2、蚁群算法在分类规则挖掘中的应用。提出了一种改进的基于蚁群算法的分类规则挖掘算法—基于自适应机制和变异策略蚁群算法的分类规则挖掘算法。改进的算法采用了不同的信息素更新方法,引入了自适应机制及局部变异和全局变异相结合的变异策略。算法采用局部变异概率及信息素残留度作为自适应参数,在进化过程中进行自适应调整,较好地解决了加速收敛和停滞早熟的矛盾。实验结果表明,该算法能够达到加快收敛速度、缩短计算时间、提高预测准确率、挖掘出更简洁规则的目的。 3、蚁群算法在分布式分类规则挖掘中的应用。本文还将蚁群算法引入到分布式数据挖掘当中,提出了一种基于蚁群算法的分布式分类规则挖掘算法,对该算法进行了模拟实验。实验结果证明,将蚁群算法应用于分布式分类规则挖掘中是一种新颖而有效的方法,不仅可以提高分类的准确率,而且还可以充分发挥分布式处理速度快和节省存储空间的优势。
其他文献
从利用密钥托管技术保障保密通信的安全性出发,以实现网络保密通信中密钥的托管和恢复为目的,对密钥托管技术进行了学习研究,在密钥托管机制的设计上进行了一些总结和探索。总结
无线传感器节点能量有限且通常部署在环境特殊的广阔区域中,因此节能是设计无线传感器网络应用首要考虑的问题。MAC协议决定节点接入信道的方式,直接控制节点能耗最多的通信模
论文对虚拟海洋环境的仿真进行了探讨,主要完成了以下四个方面的工作:首先,从随机海浪构造模型出发,利用海浪谱对海浪进行仿真控制,并且从波面细化,颜色处理和光照控制三个方面提出
计算机网络的迅速发展为全球范围内实现高效的资源共享和信息交换提供了方便。同时,由于计算机网络的开放性和共享性,其安全性已成为人们日益关注的问题。在世界范围内,针对计算
随着Internet的发展,电子邮件得到了普及,它的广泛使用给人们的生活带来了极大方便。可是,一些人出于个人私利,利用电子邮件的便利滥发垃圾邮件,不仅消耗了大量的网络资源,还使大量
随着世界经济全球化的发展,电子数据交换已成为企业参与贸易竞争的重要手段,企业迫切需要在更大范围内实现资源共享与数据交换。由于企业的平台和数据模式各不相同,传统的数据交
Ad hoc网络因其开放的信道、分布式合作、动态拓扑、无中心授权等因素,使得其路由协议的安全性比传统网络复杂得多,攻击者不仅可以对网络中传输的信息构成威胁,通信节点的身份、
SAR (合成孔径雷达)是一种成像雷达,主要用于机载星载拍摄高清晰度图像。它将合成孔径技术、脉冲压缩技术和数字信息处理技术三者结合起来,使用较短的天线,获得方向和距离两个方
现有的序列模式挖掘算法能有效地在大型数据库中挖掘出完整的序列模式集。然而,随着应用领域越来越细化,用户对挖掘出来的序列模式提出了更高的要求。因此,将用户的要求或兴
在企业中采用产品数据管理系统(PDMS),在一定程度上提高了企业的竞争力。但是随着网络和数据库技术的飞速发展,产品数据管理系统已不能满足企业新的需求。因此,结合现有的先进的