基于Spark的权重树随机森林算法

来源 :中国科技信息 | 被引量 : 0次 | 上传用户：cuichenyyy

【摘要】

：

高维数据中很多特征所含有的分类信息少，面对这些数据，随机森林算法会产生很多分类能力弱的决策树，而其在集成决策树时无法差异化区分每一棵决策树，造成分类能力弱的决策树影响算

【作者】

：

牛志华

【机构】

：

中国民航大学电子信息与自动化学院

【出处】

：

中国科技信息

【发表日期】

：

2017年13期

【关键词】

：

随机森林权重算法分类信息分类能力高维数据分类决策决策树

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高维数据中很多特征所含有的分类信息少，面对这些数据，随机森林算法会产生很多分类能力弱的决策树，而其在集成决策树时无法差异化区分每一棵决策树，造成分类能力弱的决策树影响算法整体的分类性能。针对这一问题，提出一种权重树随机森林算法，依据权重对树进行集成，增强分类能力强的树对分类决策的权重，同时削弱分类能力弱的树对分类决策的权重，从而提高整个随机森林的分类决策性能。单机运行模式不能满足高效分类高维数据的需求，开源集群计算框架Spark能够内存缓存，在迭代计算上具有较高的效率，因而将权重树随机森林算法在Spark

其他文献

新粉末涂料固化剂开发成功

期刊

粉末涂料开发成功固化剂双酚本体聚合环氧树脂工艺过程化工材料西安有限公司

以24000r／min的速度和70kW的功率切削铝

在高速机械切削领域，提高生产率一直是一个亟待解决的问题。在高速切削机床中刀具轴是一个重要元件。Fischer公司配备有一流的HSCMFW-2310／24VCHSK-A63刀具轴，在其工作范围内有

期刊

机械切削生产率高速切削刀具轴转速机床

低温胁迫下草菇海藻糖磷酸化酶基因表达变化研究

海藻糖是真菌抵御逆境的重要渗透调节物质之一，其合成与分解受海藻糖磷酸化酶（ trehalose phosphoryl-ase，TP）调控。以草菇低温敏感型菌株V23和耐低温型菌株VH3为试验材料，研究了

期刊

草菇低温海藻糖磷酸化酶基因RT-PCRVolvariella volvacea low temperature trehalose phosphoryl

CPC分类号在医疗信息领域的应用

CPC（cooperative patent classification）分类体系是欧洲专利局（EPO）和美国专利与商标局（USPTO）联合开发的用于专利文件的全球分类系统.其正式签署协议是于2010年10月25日,并于20

期刊

分类号CPC信息领域应用医疗欧洲专利专利文献分类体系

瓦尔特与中国航空制造业一同腾飞

期刊

瓦尔特有限公司中国航空制造业数控工具磨床铣刀产品开发

木耳红外变温干燥装置研究

本文在提高干燥后木耳品质及降低能耗的研究基础上，应用红外线加热技术和对流热风干燥技术相结，干燥过程中通过称重平台对木耳进行第一次称重和第二次称重，系统记录数据并与干燥

期刊

干燥装置红外线木耳变温热风干燥技术加热技术干燥过程记录数据

老人跌倒检测技术专利申请分析

跌倒是影响老人健康的主要因素之一,检测老人跌倒从而使之获得及时有效的救助,这具有重大的社会意义。本文依据国家知识产权局专利检索与服务系统中公开的老人跌倒检测技术领

期刊

检测技术专利申请老人国家知识产权局社会意义服务系统专利检索专利文献

你是网络会员吗？

<正>~~

期刊

烟台包装业凸显三大亮点

4月29日，山东省烟台市包装行业协会正式成立，烟台包装产业正迈入新阶段。本期聚焦烟台包装业，探寻这个企业数量超1000家、规模以上包装工业主营业务收入超330亿元的包装企业聚集

报纸

康复护理对类风湿性关节炎患者生存质量的干预研究

类风湿性关节炎（RA）是以慢性进行性对称性关节炎为主的一种全身性自身免疫性疾病,目前尚缺乏根本治疗的方法。疾病自身、生理功能受限可导致RA病人中存在着多种精神症状,最常见

期刊

康复护理类风湿性关节炎生存质量

基于Spark的权重树随机森林算法

与本文相关的学术论文