一种健壮有效的决策树改进模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:shamobingshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文提出了一种健壮有效的决策树改进模型R-C4.5及其简化版本。该决策树模型基于著名的C4.5决策树模型,但在属性的选取和分枝策略上进行了改进。对每一个属性计算对应样本子集的熵和样本子集熵的平均值,并将样本子集熵的值不小于平均值的样本子集进行合并,形成一个临时的复合样本子集,即合并分类效果较差的分枝。利用临时复合样本子集的熵值和未合并样本子集的熵值计算该结点的修正信息增益,并选择具有最高修正信息增益的属性作为当前结点的测试属性。其分枝对应于未合并样本子集和复合样本子集。该模型的简化版本在数据预处理阶段完成
其他文献
该文提出了非线性状态方程约束下的一类动态多尺度系统的模型及估计方法,该系统的状态方程是非线性的,多个传感器在状态空间的一个闭子空间序列中对系统状态进行观测。该文用状
应当从投资人的投资成本角度研究基金费用问题,进而据此设计基金费用。
信息素质教育一般包括信息意识教育、信息能力教育、信息品质和道德教育3方面的内容。本文论述了高校图书馆开展大学生信息素质教育的思路、模式及途径。
美国GE公司前CEO韦尔奇说:“预算是美国公司的祸根,它根本不应该存在。制定预算就等于追求最低业绩,你永远只能得到员工最低水平的贡献,因为每个人都在讨价还价,争取制定最低指标
文章分析了高校图书馆用户知识需求的特点,并在此基础上提出了高校图书馆知识服务的实现策略。
聊天室是人们在网上交流的一种重要手段,由于硬件设备、网络带宽的限制,目前广泛使用的聊天室只能基于文本和语音,不能基于人脸形象。以已经实现的“一个基于SAPI5.0的中文语音动
文章认为,专业图书馆应当以科技创新需求为导向,搞好文献信息资源建设;提供多种文献服务方式,为科研创新服务;建立资源与服务推介及用户培训机制,增强用户的信息意识。
混沌序列具有易于生成、对初值敏感和类白噪声的性质.因而适合应用于密码系统设计。文章将二维猫映射推广到三维,并综合运用一维无限折叠、Chebyshev、Lorenz等三种较复杂的混
陈天桥就像一条随时伺机出击的鲨鱼,一直扮演着资本凶猛的角色。谁知道他的下一个猎物又将是谁?
重点报道了以(1R,2S)或(1S,2R)-1,2-二苯基-2-氨基乙醇衍生物手笥配体的合成及其用于不对称催化反应的研究,如去氢氨基酸的氢化,醛的乙基锌加成,酮的还原,活泼亚甲基化合物的烷基化,醛的硅腈化和瑞福马斯