基于免疫遗传算法的决策树分类研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:ninikao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为当前的热门研究领域,已广泛应用于科学研究和商业预测等领域,拟从大量的数据中提取潜在的、人们感兴趣的、有用的信息。数据分类是数据挖掘的一个重要分支,按照一组数据对象的特征给出数据对象划分的过程。  本文研究的是基于决策树的分类技术。决策树学习采用自顶向下的递归方式,类似于树的生长,经过层层分枝,最终形成若干个叶子结点,每个叶子结点代表一个决策类别。  由于传统的决策树分类算法存在准确率低下的缺点,为了解决这一问题,本文将人工遗传学和免疫学理论应用于决策树算法,提出了基于免疫遗传算法的决策树分类算法。遗传算法是一种模拟达尔文的遗传选择和自然淘汰的生物进化过程而形成的一种全局优化概率搜索算法。免疫遗传算法是将生物免疫机制原理引入到标准遗传算法中,克服遗传算法的早熟收敛问题,提高全局搜索能力。  本文围绕免疫遗传算法理论及其在决策树的构造这一问题,开展研究工作,并取得了较好的效果。  本文主要研究内容和工作成果如下:  (1)系统阐述了决策树学习算法的工作原理和实现方法,并分析了典型的决策树算法之间的优缺点。  (2)详细阐述了遗传算法及免疫遗传算法的工作机理,比较了两种算法的优缺点。  (3)将遗传算法应用到决策树分类方法中,利用遗传算法的全局搜索能力及并行处理能力,以提高决策树算法收敛速率。同时考虑到决策树生成效果的评价因素,提出了兼顾分类的准确度、支持度、简洁度、信息增益率的评价标准体系,作为遗传算法的适应度。实例分析表明,遗传算法在精确度上高于传统的决策树分类方法。  (4)提出了一种基于免疫遗传算法的决策树算法,该算法将免疫算子引入到遗传算法中(包括抽取疫苗,接种疫苗,选择疫苗),以提高决策树分类的质量和效率。实验结果显示,免疫算子的加入,提高全局搜索能力,确保快速收敛于全局最优解。通过对基于免疫遗传算法的决策树算法与基于简单遗传算法的决策树算法的实验结果比较,表明基于免疫遗传算法的决策树算法在保证分类精确度的同时,也使得产生的规则简洁易理解。
其他文献
计算机视觉的基本问题是利用2D投影图像来重构3D物体的可视部分,其研究成果可直接应用于机器人、医学、精密工业测量、遥感、虚拟现实等众多领域,无论在军事及民用领域都具有
组合仿真是根据特定的仿真需求重用已有仿真组件的技术,在节约仿真系统开发时间,提高系统开发效率,降低系统开发复杂度方面作用明显。目前,研究学者已经提出一些组合仿真相关的理
近年来,随着P2P应用的不断扩展,P2P网络技术成为业界关注的一个热点。国内各高校都在积极研究如何将P2P网络技术应用到网络教育上,即充分应用P2P网络的分布性、交互性、扩展性、
虚拟仪器(Virtual Instruments, VI)充分利用现有计算机资源,配以独特设计的软硬件,实现普通仪器的全部功能以及一些在普通仪器上无法实现的功能。“软件即仪器”的思想实现
秘密共享是应用密码学领域的研究热点,它改变了传统的单人加密/解密、签名和认证模式,能够分散责任,防止权威欺骗,提高系统的安全性,对重要信息的安全保存、传输及合法利用具
本课题针对于“数据结构”的教学现状,规范了类C语言的定义,并在此基础上设计实现了将类C语言源算法翻译成可执行的C语言目标程序的编译器——LC/C编译器。定义的类C语言,其
指纹具有唯一性和不变性,所以指纹识别一直是个人身份鉴别最有效的方法之一。自动指纹识别系统是图像处理和模式识别领域里的一个重要研究课题,具有很高的应用价值和市场前景
随着目前信息技术不断发展,现代计算机系统无论是在自身的结构和设计属性还是系统的使用模式上都变得越来越复杂。特别是近几年来高速互联网络的普及和计算机处理能力的飞跃
Web服务作为一种开放的业务提供方式,以松耦合、语言无关、平台独立等特点,得到了工业界和学术界的广泛认可。Web服务已经成为Internet和下一代互联网信启、和服务的主要提供
当前随着网络的普及,通过网络的计算机犯罪也随之而来,这促使了一大批网络安全产品的出现与发展。但是当前市场的各种各样的,例如防火墙、入侵检测、网管系统、审计类产品等往往