前向决策树算法的研究与改进

来源 :河北大学 | 被引量 : 0次 | 上传用户:yfs245324210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树学习是应用最广泛的归纳推理算法之一。目前存在的决策树归纳算法大多数是基于自顶向下的贪婪算法,它在每个结点都执行一个局部最优决策。然而,在大多数情况下,贪婪算法构造的树不是全局最优的。对于贪婪算法的改进,前向搜索是一种众所周知的技术。大多数人认为,前向决策树算法产生的决策树优于贪婪算法,并且搜索深度越深其效果越好。然而,在实际中前向决策树算法得到的结果并非如此,许多文献通过实验指出在决策树归纳过程中前向搜索往往会伤害决策树的质量。本文以ID3算法为基础,研究了前向决策树算法,并与贪婪算法的建树过程进行了对比。通过实例将前向决策树算法与经典的ID3算法进行了比较,结果表明针对某些特定的问题前者在保证分类精度不降低的同时也简化了决策树。本文还重点分析了前向决策树算法存在的缺点,正是由于算法本身存在的这些缺陷使得产生的决策树没有质量上的提高。为了改进前向决策树算法,本文提出了一种基于属性约简的建树方法——受限制的前向决策树算法。改进后的算法限制了前向决策树算法的搜索空间,首先使用属性约简方法选择出一个属性子集,然后在预先选定的属性子集中使用前向搜索方法寻找最优分裂属性进行决策树的建造。通过在部分UCI数据集上做实验,可以看出本文提出的方法能减小决策树的规模,提高预测精度。
其他文献
随着现代信息技术的不断发展,学校的各项业务也逐渐智能化、信息化。其中,最为显著的就是校园一卡通的应用。本文以山西师范大学校园卡关于学生就餐交易数据为研究对象,通过
随着技术的发展与科学的进步,数据量的飞速增长已成为一个不容忽视的问题,面临堆积如山的数据,想要获取有用的信息与知识并非易事。因此数据挖掘技术伴随着人们的需求与科技
企业信息门户是企业信息集成一种可行的解决方案。为了达到企业信息集成的目的,企业信息门户通过Portlet组件之间进行数据交互通信协作来实现。不过目前Portlet规范并没有明
近年来,基于内容的图像检索系统(CBIR)是一个热门的研究话题。传统的图像检索系统通常根据图像的底层特征(颜色、纹理和形状等)建立索引进行检索,但这种基于全局的方法在图像
随着计算机技术和通信技术的发展,人类之间的交往变得越来越便利,但信息安全隐患却愈加突出。所以,实时准确的个人身份认证技术也就应运而生了。手写签名作为一种身份鉴定的
决策树可以分为两类:清晰决策树和模糊决策树。通常,模糊决策树算法是在清晰决策树算法的基础上进行改进得到的,是对清晰决策树算法的扩展。本文从相反的角度出发,对Yuan提出
电子商务,正逐渐改变着人们的生活方式,已成为当今世界的主流产业之一。然而,由于各企业的系统在网络结构、软硬件平台、系统结构特别是数据库系统结构上的差异,导致企业与企
实时系统是面向方面技术很好的应用场所,在实时系统中,有很多非功能需求,且这些非功能需求往往横切整个系统。在实时系统中关键的就是时间要求了,这些时间要求散布在整个系统
智能交通系统(ITS, Intelligent Transportation System)是目前全球广泛研究的课题,近20年随着我国公路交通事业的飞速发展,我国的公路长隧道及地下通道的不断增多,隧道自身
论文针对传统RBAC模型在大规模企业应用中存在用户授权分级管理实现复杂的不足,提出了一种基于自治域的RBAC改进模型(AD RBAC)。AD_RBAC模型引入“自治域”概念形式化描述企