对决策树连续值找分割点的算法的改进

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:chenrongxu222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是数据研发领域里研究和使用最广泛的技术之一。近几年经济的飞速发展,分类问题在多行业和领域中被广泛使用,那么,怎样更准确、更有效地分类呢?这是多数研究工作人员的目标。决策树(decision tree)以条理清晰,程序严谨,定量、定性分析相结合,方法通俗易懂,容易掌握,应用性较强等优点,被广泛应用。现在构造决策树的算法比较多,如:ID3算法、C4.5算法、CART等。C4.5算法是在ID3算法的基础上进行改进的,C4.5算法选用信息增益率(Info Gain Ratio)为择取分枝属性的标准,此方法
其他文献
如果有哪个时代需要创造性观念,那么就是现在。持续的全球变暖从未令我们如此近切地注意到目前总体性的气候破坏,这将意味着世界的末日,如我们所知道的。这一趋势很大程度上
摘 要:资源端向目的端信需要往返传输时延时,会给TCP拥塞控制本身具备的稳定及快速性带来很大影响。因此,可以采用Smith的控制理论,并且进行随机早期的检测算法,提出的RED具有预测的能力,称为P-RED算法,实现及时、快速的对TCP拥塞控制的稳定性能,除此之外,在理论上阐述了P-RED算法的稳定性能,并且算出了算法中涉及的主要参考数据的理论数值范围,有效指导参数做出合理的设置,从根本上对理论的整
<正> “无意苦争春,一任群芳妒”,用陆游笔下的梅花来比喻现时的浪潮通软(genersoft)是再好不过了。长期以来,浪潮通软(编者注:以下简称通软)在业界很是低调。业内人士谈起ER
作为一种方便、快捷、有效的查号系统,114查号系统在人们的工作及生活中均得到极为广泛的应用,特别是近些年来,随着各种通信技术的发展及应用,114查号系统的数据库得到了进一步拓
【正】 最近,全国126所高等院校的教师、44个报刊、出版单位的编辑和部分理论研究工作者、批评家和作家在江西省庐山举行文艺理论学术讨论会。这次学术讨论会的中心议题是:总
中国公民利益表达与聚合的民主范式与民主形态产生了突破性发展,一是公民在国家权威主导下"政治安排"被动但直接地参与政治活动,二是公民在契约原则下合群结社"政治嵌入"主动
随着科技的进步,电商时代的到来,网络消费日益盛行,因此也会出现许多的相关网络消费资金安全的系列问题,这也是制约了网络消费的关键因素。网络消费因其特有性,在资金安全方面的问
【正】 段瑞华同志在《试论生产力发展的根本动力和主要动力》一文中,强调人的物质需要是生产力发展的根本动力(推动生产发展的最终动力、经常起作用的动力);同时指出,生产力
随着社会科技的不断进步,计算机技术以及网络技术得到飞速的发展。网络应用已经在各个行业起到重要的作用,在个人以及企业享受网络发展所带来的便捷和利润的同时,网络的安全问题
界定作为学科规制的侨易学研究对象的“侨易现象”,强调其既非单纯的位移现象,也非纯粹的思想现象,而是物质现象与精神现象的结合,并规定其内涵与外延。进而讨论侨易现象的动态过