一种改进的ID3决策树算法研究

被引量 : 0次 | 上传用户:a24287490
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其基本思想是,通过一批已知的训练数据建立-棵决策树,然后利用建好的决策树,对数据进行预测。至今已经提出了决策树的很多算法,通过分析已知的分类信息得到一个预测模型,ID3算法就是其中比较经典的算法。但是ID3同样也存在不足,如学习简单的逻辑表达能力较差、属性的多值偏向等。那么,对ID3算法的这些不足进行改进就是本文的着眼点和主要研究内容。通过对ID3算法的分析,提出了AR-KOS算法,即知识优选策略的属性递归改进算法。试验表明,该算法对ID3算法有所改进,并且生成的决策树是二叉树。所以,自然地将两者结合起来,发挥各自的优势,就可以得到一个性能良好的改进算法。将信息增益的属性递归优化方法应用到高考招生测评的数据挖掘中,并且根据实际需要在高考招生测评工作中进行了测试。同时,对AR-KOS算法与ID3算法进行同例比较,发现新的改进算法的决策树更加简洁、更接近于理想的决策树。
其他文献
本研究选择以中国古代糖史为题,从农业经济史和传统饮食文化的新角度,对糖源,糖的生产与商品化,糖制品的消费以及糖对甜食文化发展的影响等问题进行研究,深化了对中国古代糖
自党中央国务院提出社会主义新农村建设以来,新农村规划工作在全国如火如荼开展开来,但在发展建设方面重视物质空间环境的建设,致使农村的生态环境越来越受瞩目,特别是山区农
在静息状态下,通过探测人脑功能网络的同步性(功能连接),可以反应人脑的功能组织特点,为脑功能研究提供线索。该方法比任务功能磁共振具有更好的临床实用性,然而在毒品成瘾的
本文从作定语的数量词入手,统称这类数量词为数量定语。数量定语在具体句子的运用当中有着与别的定语不一样的特征:首先,数量定语和名词中心语形成的结构属于组合式偏正结构,
改革开放以来,伴随着经济的快速发展,中国的M2/GDP一直呈现上升趋势,2007年这一比例已达1.62,远远超过世界其它国家。这一“超额”货币供应与低物价水平并存的现象,大量“迷
人类的消费行为伴随着人类文明的进程,在消费的过程中,不断的消耗资源,并持续向生态系统排放废弃物。尤其今日,扭曲的消费模式引起全球日益加重的资源危机和环境危机。在我国
何谓政治哲学?斯特劳斯认为,政治哲学就是要试图真正了解政治事物的性质及其正确的或完善的政治制度两方面的知识。王南湜教授则认为,政治哲学是对政治生活的哲学反思,指向理
生态防护技术是随着世界范围内高速公路建设而兴起的一门工程技术。与传统的工程防护技术不同,生态防护技术是工程防护与植物防护的适当结合,其充分利用工程防护深层加固和植
庭院景观艺术在日本文化领域中是一种特殊的文化载体。作为艺术,它既具有有形的物质构成要素,又是传统文化的历史结晶。民族风格、气质、形式,凝聚着千百年来各民族的审美实
目的:观察院内制剂七星丹对臁疮的临床疗效,为其在临床上推广应用提供一定的依据。方法:将符合纳入标准的64例病人随机分为两组,治疗组32例,对照组32例,分别给予七星丹和传统方