基于遗传算法的决策树剪枝方法

来源 :河北大学 | 被引量 : 0次 | 上传用户:acdef2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树剪枝是决策树优化的常用方法。在保持决策树分类精度的前提下,该方法通过去掉决策树中某些子树的方法,达到减小决策树规模的目的。目前的决策树剪枝方法按照一定顺序遍历决策树包含的所有子树,以决策树的分类精度或者规模为依据决定子树是否应该被移除,因此剪枝效率较低且存在着一定的剪枝偏置。本文提出了一种两阶段的决策树剪枝方法。其中第一阶段使用遗传算法对剪枝决策树空间进行搜索,来构造当前最优决策树集合;第二阶段综合决策树的分类精度,规模和稳定性三方面因素,从当前最优决策树集合中找到一棵决策树作为最优剪枝后决策树。基于遗传算法的决策树剪枝方法由于采用多标准评价决策树子树,克服了原有剪枝算法的偏置。同时引入遗传算法来加速剪枝决策树空间的搜索速度。在多个UCI数据库上的实验结果表明,使用该方法得到的决策树很好的平衡了决策树分类精度和规模之间的关系,使得剪枝后的决策树具有良好的分类性能。
其他文献
随着实时计算在众多领域中的渗透,嵌入式实时操作系统的使用越来越广泛,其安全性与可用性也越来越受关注,特别是在对安全性与可用性有着高要求的航空航天领域。传统的嵌入式
近几年来,关于微电网技术方面的研究是国内外电力系统研究的热点和重点,而控制问题是微电网在实际运行中需要解决的关键问题之一。本论文的研究主要是围绕着微电网的控制问题而展开的。本文论述了国内外微电网的发展情况,微电网概念和结构,以及微电网的一些关键技术。多智能体技术具有自治性、社会性、反应性、协调性,并且具有很强的推理能力,以及自组织能力和学习能力,可以很好的解决微电网控制中的问题,所以本文提出了基于
在网络图像资源呈爆炸式增长的今天,如何有效地管理这些资源并让用户可以方便地访问其所需要的图像成为众多研究的焦点。基本方法主要包括图像检索和图像浏览,而图像标注则是
随着计算机技术和移动通讯技术的迅猛发展,建立在移动通信技术基础上的一种新的计算模式—移动计算(mobile computing)模式获得了飞速发展。目前以广播模式发布数据来支持并
图作为反映数据中携带信息最重要的一种表达方式,在许多领域得到广泛的应用。而热图是超越传统图形意义的一种新型的信息可视化方式,在现代的可视化领域中,热图的使用更加广
随着Internet技术的发展,网络应用服务越来越丰富多彩。为了对互联网中各种各样的流量实施有效的监控,首先需要使用协议识别技术来分辨网络流量的不同应用类型,然后才能够有
在研究Web服务组合中存在着一个重要问题是怎么样使用进程代数形式化的描述Web服务组合并且证明Web服务组合的正确性。用Pi-演算建模Web服务组合的模型可以用来检查、验证Web
本文研究了基于CART(Classification and Regression Tree)算法的基因芯片数据的分类问题。基因芯片技术对于早期癌症的诊断和确诊是一个革命性工具,它从基因表达的角度判断
由于网络的飞速发展,当前的网络正面临严重的安全和管理等方面的挑战,保障网络的可控性成为当今网络发展的迫切需求,国内外许多组织都针对该问题陆续开展了相关研究工作。针对当
随着网络技术和即时通信技术的飞速发展,即时通信工具随之得到了广泛的应用。这一通信工具领域的革命,改变了人们以电子邮件为主的传统的通讯方式,使协同化办公中需要员工互