基于类别随机化的随机森林算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zye284818093
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随机森林是数据挖掘和机器学习领域中一种常用的分类方法,已成为国内外学者共同关注的研究热点,并被广泛应用到各种实际问题中。传统的随机森林方法没有考虑类别个数对分类效果的影响,忽略了基分类器和类别之间的关联性,导致随机森林在处理多分类问题时的性能受到限制。为了更好地解决该问题,结合多分类问题的特点,提出一种基于类别随机化的随机森林算法(RCRF)。从类别的角度出发,在随机森林两种传统随机化的基础上增加类别随机化,为不同类别设计具有不同侧重点的基分类器。由于不同的分类器侧重区分的类别不同,所生成的决策树的结构也不同,这样既能够保证单个基分类器的性能,又可以进一步增大基分类器的多样性。为了验证所提算法的有效性,在UCI数据库中的21个数据集上将RCRF与其他算法进行了比较分析。实验从两个方面进行,一方面,通过准确率、F1-measure和Kappa系数3个指标来验证RCRF算法的性能;另一方面,利用κ-误差图从多样性角度对各种算法进行对比与分析。实验结果表明,所提算法能够有效提升集成模型的整体性能,在处理多分类问题时具有明显优势。
其他文献
对远志的炮制方法和现代研究进行归纳和总结,详细介绍了远志的净制、不加辅料炮制、加辅料炮制法,概述了远志去心、炮制对远志化学成分、药理作用及毒副作用的影响等现代研究
【正】 一个城市的兴起和发展同水源的关系十分密切,西安城能够延续数千年之久,也正是当地水源充沛的具体表现。解放以后,随着城市供水技术的发展,西安市的供水主要依靠开采
背景和目的:内镜下黏膜剥离术(Endoscopic submucosal dissection, ESD)被广泛用于消化道早期肿瘤及癌前病变的治疗,具有创伤小、术后恢复快等优势。然而,ESD术可引起医源性溃
简介了上海宝钢化工有限公司三期精萘静态分步结晶工艺,提出了通过结晶工艺参数来计算装置生产能力的计算方法。该方法能判断调试平稳新装置产能达标情况,并可结合结晶工艺参
作为中国新文学作家中最杰出的代表之一,茅盾1从译介外国文学走上了文学道路。从1917年到1949年,茅盾翻译了30个国家的200余篇文学作品,撰写了大量评论、介绍外国文学的文章,
随着信息时代的到来,信息化教学手段已被课堂教学普遍采用。本文探讨了中学历史教学信息化的现状及推进现代信息技术在中学历史教学中的运用的一些举措。
<正>1978年Tayllor[1]报道了以旋髂浅动脉为蒂设计游离髂骨皮瓣。旋髂浅动脉主要供应髂腹股沟皮肤,位置浅,该部位皮肤皮下脂肪少,部位隐蔽。穿支皮瓣符合组织移植受区修复重
<正>随着社会的进步、时代的发展,预应力多孔板逐渐被淘汰出局,现浇楼板应用的普及,无疑给住宅工程增大了保险系数。但在使用过程中由于现浇板产生细裂缝也带来一些负面影响,
福建省防灾减灾隔震大楼自2005年8月架设强震观测结构台阵以来,已多次记录到大楼地震动力反应,这些宝贵的结构反应资料对于评价隔震效果、分析结构反应特性具有十分重要的价值
<正> (一) 当中国从荒漠的氏族社会进入以君主为国家象征的阶级社会之后,历代王朝无论是分裂割据,还是归于统一,都无例外地对人口的控制给予了极大的关注,其最主要的表现便是