示例学习的决策树算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:xumingxingHUANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树分类学习算法是使用最广泛、实用性很强的归纳推理方法之一,在机器学习、数据挖掘等人工智能领域有相当重要的理论意义与实用价值。 在各种决策树学习算法当中,最有影响力的是采用信息熵的下降速度作为选择测试属性的标准的ID3算法。但是ID3算法存在学习简单逻辑表达式的能力较差、偏向属性取值数目较多等缺陷。论文企图在ID3的基础上,针对其中的一些不足加以改进。 本文首先介绍了示例学习的扩张矩阵理论与决策树学习的最优化问题、ID3算法的信息论原理与实现以及C4.5算法的剪枝原理。然后针对ID3学习逻辑表达式方面的不足,提出了一种对ID3学习到的决策树进行简化的算法——基于蕴含规则的决策树简化算法(DTSA-BOIR,简记为BOIR),BOIR以ID3算法构造的决策树为基础,先序遍历由ID3构造出来的决策树的各个节点,并对其子树进行比较,如果各子树的根属性都相同而且存在某些相应的分支对于各子树完全相同,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。 本文实现了BOIR对逻辑表达式的学习,并利用FAMn家族数据集对该简化算法进行了测试,实验所取得的数据验证了该算法的有效性。
其他文献
随着国内航空运输业的迅猛发展,航路的流通能力不断扩大,对空中交通安全提出了更高的要求,这迫切需要使用大量的可靠、功能完善、性能先进的空中交通管制系统(ATC).而在以往
随着Internet的飞速发展,网上丰富的资源对人们产生着巨大的吸引力,Internet已经成为获取信息的重要手段之一,这就使得接入访问Internet成为当今信息业最为迫切的需求,同时伴随而
为了在嵌入式Linux中能够方便快捷地使用“非易失性”的嵌入式存储卡,有必要对嵌入式Linux中的存储卡驱动开发加以研究,从而构筑一个嵌入式Linux的存储子系统。根据嵌入式Lin
随着Web的不断增长,人们对Web信息检索系统提出了更高的要求。Web信息检索也逐渐成了互联网研究中的一个热点。近年来,又有一些学者提出了面向特定主题的Web信息检索方法,以满足
Web服务以其独特的魅力越来越受到IT领域的广泛重视,而由于其基于网络的特性,安全问题就不可避免地成为开发者和公司的最大关注点。现有的Web服务安全机制确实在很大程度上保护
随着软件规模的不断扩大,软件错误也越来越容易产生。尽早地检测软件中的错误是软件开发过程中的一个重要任务,也是降低软件开发成本的主要手段。特别是针对人机交互操作较多的
软件测试是保障软件质量的重要方法。组合测试是一种有效的黑盒测试方法,能够有效地探测由参数交互引发的软件失效。组合测试数据生成是组合测试领域重要的研究方向。近年来,基
我国网民规模和互联网普及率迅速提升,其中网络游戏用户占整体网民很大比重。在近些年我国的游戏行业市场中,客户端网游的市场持续增长,电子竞技在客户端网游收入中占比越来越大
网络管理系统中的安全管理有两层含义,即网络的安全管理和安全的网络管理。相应地,安全管理子系统的功能也可分为两部分,一是网络管理系统本身的安全,二是被管网络对象的安全
随着科学可视化技术的成熟和发展,医学成为虚拟现实(VR)的主要应用领域之一。VR在医学领域上的一类重要应用是手术仿真系统,就是专门用来模拟在手术过程可能遇到的各种现象的虚