MapReduce环境下处理多类别不平衡数据的改进随机森林算法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:tingyu263
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统MapReduce环境下的随机森林算法在处理多类别不平衡数据问题时仍然以全局最优点作为划分点,忽略了少数类对分类准确率的影响,文本提出了一种MapReduce环境下处理多类别不平衡数据的改进随机森林算法(MR-RF-SHDSE).该算法利用分层采样方法在各个类别中进行样本抽样,并以HDDT决策树作为基学习器以弱化数据偏置给分类准确率带来的影响,最后计算决策树的GMean值和不合度值,利用调和平均值作为衡量标准对决策树进行选择集成.通过实验证明,相比其他算法,MR-RF-SHDSE能够有效提高了对多
其他文献
对辽东本溪连山关、高家沟和营口后仙峪三个花岗岩样品进行了LA-ICPMS锆石U-Pb定年、微量元素以及全岩主量元素分析,计算了锆石饱和温度和Ti温度。连山关和高家沟花岗岩锆石U
概述了创新教育的内涵和内容,并论述了教师在创新教育过程中的积极作用.
根据省、市乡镇综合配套改革的统一部署,武汉市蔡甸区立足实际,以实施乡镇事业单位机构改革为切入点,以探索建立“以钱养事”新机制为核心,积极稳妥地推进乡镇社会事业体制机
期刊
是王勃恣肆、宏富、绚烂、经典的《滕王阁序》,召引我到南昌去看滕王阁。认同了"到南昌不看滕王阁等于没有到南昌"的流行说法。
期刊
针对夏季气温高、蒸腾快、离体的嫩枝易失水导致萎蔫死亡的特点,总结了生产上常用夏季扦插育苗的几个关键技术.
当前,培养学生的创新能力和实践能力是素质教育的重点.在历史教学中,我们要实施素质教育,培养学生的创新精神.
河南省人民政府办公厅关于印发省政府1996年度立法计划的通知豫政办[1995]118号(一九九五年十二月七日)《省政府1996年度立法计划》业经省政府批准,连同省人大常委会立法计划中由省政府提请的立法
河南省人民政府关于进一步加强政务督查工作的通知豫政[1996]2号(一九九六年一月十七日)近几年来,全省政府系统督查部门紧紧围绕党委和政府中心工作,坚持"围绕中心,督促落实,突出重点,注重实
本文以发达国家美国、加拿大、日本为例,对发达国家环境审计的成功经验进行分析,总结了发达国家环境审计的成功经验的共性及差异,并通过对我国与发达国家环境审计的对比分析,