决策树C4.5算法的优化与应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:sometimestry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
C4.5算法作为目前最具影响力的决策树分类算法,仍存一些不足之处。针对C4.5算法在对连续值属性离散化处理过程中比较耗时的缺点,基于Fayyad和Irani的边界定理,在连续属性离散化之后使用Gini指标代替信息熵对算法进行了化简。针对决策树算法中的过度拟合问题,基于Occam’s razor,采用再带入估计,对算法进行了改进。将上述思想应用于金融借贷数据,实验结果表明,改进的C4.5算法在保证准确率的前提下,执行时间平均降低8.74%,模型复杂度平均降低6.26%,表明了该算法的有效性。
其他文献
数学知识是在生活当中总结出来的,因此可以紧密结合数学和生活,贯通知识的学习和应用,这也符合我国新课标对于小学数学提出的要求。本文结合"购物中心的百分数运用",论述小学
爆炸物检测作为打击爆炸恐怖主义的重要措施之一,正日益彰显出广阔的应用前景.其中,静电纺荧光纳米纤维膜在爆炸物检测领域已展现出其独特的优点,可满足爆炸物检测所需的检测
针对传统自适应控制算法,实际工业过程在不同工况下的模型参数突变时系统暂态响应特性较差,该文提出了基于在线学习的多模型自适应控制方法.应用动态模型库技术来建立模型库,
在农业部公益性行业(农业)科研专项“草莓产业技术研究与试验示范”子课题“草莓优良种苗繁育基地建设及新品种试验示范”项目的资助下,我们于2011年对河北省承德地区的草莓生产
正义是法律的终极价值,也是公司法的终极价值目标。正义价值要求公司法在促进公司效率的提高和大股东利益最大化的同时。妥切保护中小股东权益。而正确处理公平与效率的关系
税粮是以征收粮食为内容的税收项目,元代税粮,南与北,官与民有明显差别。江南税粮分为纳粮田土和免粮田土两类。免粮田土情况各有不同,在全部田土中所占比重各地不等。纳粮田土又
针对能源紧缺与能源安全供应问题以及能源活动所带来的环境问题,欧盟近年来实施了一系列融合了环境考虑的能源政策措施,本文称之为可持续能源政策.欧盟可持续能源政策以提高
据说,某中等专业学校,为了吸引人才,规定凡是愿意留校工作的毕业生,即可吸收其入党。听了此事,叫人很不是滋味。为了开发和建设边远地区,制定一些优惠政策,以吸引人才,这无
期刊
利用近5年(2006年~2010年)内蒙古呼伦贝尔市3个基准自动站和阿拉善盟两个基准站自动站观测资料,对内蒙古东西两地的气候观测特征进行了对比分析,结果表明,近5年两地气候差异较
“受益所有人”概念的价值在于对享受税收协定优惠的主体起到识别及限缩作用,是反税收协定滥用的一项重要措施。OECD 范本及联合国范本都引入了此概念,但皆未对其作出确切解释