基于MapReduce的ID3决策树算法并行化

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:myhululu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop提供了MapReduce并行的计算模型,适用于海量数据集的并行计算.ID3决策树分类算法可以简洁明了地构建决策树,在各行各业中被广泛地应用.但通常意义下的ID3决策树分类算法为单机算法,只能进行小数据集的处理.通过MapReduce与ID3决策树算法实现并行化,为此问题提供了解决方法.通过ID3算法与MapReduce并行计算模型相结合,实现并行化计算,验证了ID3算法的可扩展性、高效性.
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
减员增效、下岗分流是当今社会的一个热门话题.这一现象是在我国经济持续发展、改革日渐深化的背景下出现的,是我国经济发展的必然要经历一个历史过程.医疗卫生领域由于改革
从水稻三系不育系倒伏现象、类型及危害着手,分析了不育系繁殖倒伏发生的原因.不育系倒伏主要受三大因素的共同制约,即气候因素、栽培因素及亲本内在遗传因素。提出了合理密植,保
以一条全电缆正常运行的10 kV配电线路为例,利用电力系统计算机辅助设计和电磁暂态模拟程序软件(power system computer aided design and electric magnetic transient in DC
传统历史文化街区由于其自身独特的文化底蕴和历史内涵以及经济效益受到城市规划和设计者的重视。文章以历史文化名城绍兴的仓桥直街为例,运用空间句法的轴线模型,从整合度和
我院于2001年8月购进Dimension AR全自动生化分析仪一台,曾遇到1例故障,按随机故障排除手册处理,不能排除故障,通过多方查找原因,才找到并排除故障,现介绍如下,供同行参考。
期刊
学生由于自身智力水平和情感体验的不同,在学习和生活上表现出了诸多的差异。在教学过程中,只有了解每位学生的真实表现,教师才能对症下药、因材施教。而了解学生表现最好的
目的:检验喙突移位术治疗肩锁关节完全脱位的临床效果。方法:将喙突远端1/3斜行截断连同肱二头肌短头与喙肱肌联合腱一同移位至锁骨中外1/3交界处并用螺丝钉与之固定,以达到复位并
班级授课制是目前我国基础教育阶段采用的最主要、最普遍的教学组织形式,这一形式能够在一定时间内面向几十个学生进行集体教学,扩大了受教育的规模,提高了教育效率,在一定程度上
目的:探讨多普勒与CT在卵巢肿瘤诊断中的应用.方法:78例卵巢肿瘤分别经多普勒与CT检查,48例分别经彩色多普勒能量图(CDPI)与彩色多普勒血流图(CDFI)检查.结果卵巢恶性肿瘤以