基于Spark的权重树随机森林算法

来源 :中国科技信息 | 被引量 : 0次 | 上传用户:cuichenyyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据中很多特征所含有的分类信息少,面对这些数据,随机森林算法会产生很多分类能力弱的决策树,而其在集成决策树时无法差异化区分每一棵决策树,造成分类能力弱的决策树影响算法整体的分类性能。针对这一问题,提出一种权重树随机森林算法,依据权重对树进行集成,增强分类能力强的树对分类决策的权重,同时削弱分类能力弱的树对分类决策的权重,从而提高整个随机森林的分类决策性能。单机运行模式不能满足高效分类高维数据的需求,开源集群计算框架Spark能够内存缓存,在迭代计算上具有较高的效率,因而将权重树随机森林算法在Spark
其他文献
在高速机械切削领域,提高生产率一直是一个亟待解决的问题。在高速切削机床中刀具轴是一个重要元件。Fischer公司配备有一流的HSCMFW-2310/24VCHSK-A63刀具轴,在其工作范围内有
海藻糖是真菌抵御逆境的重要渗透调节物质之一,其合成与分解受海藻糖磷酸化酶( trehalose phosphoryl-ase,TP)调控。以草菇低温敏感型菌株V23和耐低温型菌株VH3为试验材料,研究了
CPC(cooperative patent classification) 分类体系是欧洲专利局(EPO) 和美国专利与商标局(USPTO)联合开发的用于专利文件的全球分类系统.其正式签署协议是于2010年10月25日,并于20
本文在提高干燥后木耳品质及降低能耗的研究基础上,应用红外线加热技术和对流热风干燥技术相结,干燥过程中通过称重平台对木耳进行第一次称重和第二次称重,系统记录数据并与干燥
跌倒是影响老人健康的主要因素之一,检测老人跌倒从而使之获得及时有效的救助,这具有重大的社会意义。本文依据国家知识产权局专利检索与服务系统中公开的老人跌倒检测技术领
<正>~~
期刊
4月29日,山东省烟台市包装行业协会正式成立,烟台包装产业正迈入新阶段。本期聚焦烟台包装业,探寻这个企业数量超1000家、规模以上包装工业主营业务收入超330亿元的包装企业聚集
报纸
类风湿性关节炎(RA)是以慢性进行性对称性关节炎为主的一种全身性自身免疫性疾病,目前尚缺乏根本治疗的方法。疾病自身、生理功能受限可导致RA病人中存在着多种精神症状,最常见