基于交互信息的连续属性决策树学习算法

来源 :河北大学 | 被引量 : 0次 | 上传用户:huojugjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Fayyad决策树学习算法的核心是使用信息熵的下降速度作为选取扩展属性标准的启发式,但它仅考虑了条件属性与决策属性的关系,没有考虑条件属性间的关系(即交互性),因此极有可能选择对继续分类无实际意义或意义相对不大的冗余属性,不能实现信息熵的真正减少.基于此种考虑,该文给出该算法的一个改进版本,它在选择扩展属性时不仅要求该属性带来的信息熵尽可能小,而且要求其与已经使用过的各属性之间的交互性(即交互信息)尽可能小.该文首先从全局角度描述这两种算法,然后从训练准确率与测试准确率,决策树的结构等方面对这两种算法进行了比较,归纳出交互信息在决策树学习算法中的作用,证明了改进算法的有效性;同时考虑将Fayyad决策树学习算法在单边三角形模糊数属性意义下进行推广,对于单边三角形模糊数属性构造出一种决策树学习算法,并对算法的复杂度,效率进行了分析.
其他文献
学位
该文组织如下:第一、二节是预备知识主要介绍与该文有关的一些背景和所做的工作.第三节中把S看作ImO中单位向量的集合,介绍了S上的一个近复结构,并给出了Kahler角的定义.第四
设κ为正整数,G为图.作者给G每点一个长为κ的任意表,如果存在一个点着色,使得每个点都可从表中得到一种颜色,则称G为k-可选色的.本文中证明了一些不含相邻三角形的平面图是4-可选
对排列上的统计量的研究是组合数学中的经典课题,至今依然十分活跃.而在这些统计量中最重要的就是major index和inversion.该文在前人的基础之上对这两个统计量又进行了进一
中学阶段的音乐欣赏课是培养学生道德情操的有效方式之一,对初中生而言,如何上好音乐欣赏课,不仅能激发学生对音乐的热爱,同时还有利于培养学生音乐鉴赏能力和对生活的热爱。
摘要:由于物理等因素的限制,感兴趣区域重建算法一直是人们研究图像重建的重点,本文研究的对象主要为单光子CT感兴趣区域的重建算法。相对应于一般CT的Radon变换,单光子CT问题
该文先讨论了一类半线性抛物系统能稳和零能控的关系,得到了系统指数能稳和零能控的等价性.采用的是变分的方法,首先对半线性系统线性化,证明了线性化系统的解映射的紧性,再
变量选择是一种常见的模型选择问题,也就是选择重要变量,在概率统计学中有着重要的意义.该文根据信息理论准则(Information Theoretic Cretera或者简称ITC)对广义线性模型和
教学改革的前景是光明的,道路是曲折的.本文笔者站在初中数学课程改革的前沿阵地,从利用已学知识、问题、生活、故事和多媒体等方面论述了创设教学情境的有效语境.
英语词汇是三大语言要素之一,是语言交流的基本材料.初中词汇教学改革是我市实施“15/20/10”有效课堂模式的重要一环,而词汇教学内容包括词汇的读音规则、构词法、理解词义