【摘 要】
:
传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台
【基金项目】
:
国家自然科学基金(61171053).
论文部分内容阅读
传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度.
其他文献
阐述了各种炎症动物模型的制作方法及机理,根据发病原因主要分为非特异性炎症反应模型、感染性炎症模型和变态反应性炎症模型。非特异性炎症反应模型模拟炎症不同病理时期造
由于复合材料的各向异性、耦合效应、层间剪切等特殊性质,复合材料结构的精确分析仿真已成为现代产品结构设计的迫切需求。基于CATIA和PATRAN二次开发,使复合材料结构模型相
针对车辆运动方向持续变化、目标车辆距离远近变化、光照强度变化等场景下,稳定且实时性地跟踪车辆的难点问题,融合自相关矩阵增量主成分分析(Incremental Principal Component Analysis,IPCA)增量学习与粒子滤波算法的基础上,提出一种新的基于表观模型(Appearance Model,AM)的车辆跟踪方法,从跟踪初始利用自相关矩阵与特征值分解构建车辆的子空间图像,通
“测树学”是林学类学科的传统专业基础课程之一,在绿色发展理念下,课程教学应更着重加强基础理论系统构建与质量理念。本文分析了测树学教学性质和特点,探讨了绿色发展理念
学界关于马麟《静听松风图》的研究较为零散,且很少有针对马麟《静听松风图》的详细考究。因此,本文主要对马麟《静听松风图》的画中要素进行全面而细致的分析,试图辨析画中
党务工作发展与创新对国有企业经济发展与服务群众创造了良好的条件,是国有企业改革发展的重要思想保障。但是,目前国企党务工作中还存在着思想认识不到位、党务专业人才缺乏
正冈子规(1867-1902)以俳句革新家的身份享誉日本文坛,但是,他和很多明治初期的知识分子一样,其学问是从汉诗、汉文的学习开始的。因此,有必要从汉诗文的角度来研究正冈子规
目的:观察天麻钩藤饮治疗椎动脉型颈椎病肝阳上亢证的临床效果。方法:将2013年4月-2015年12月在湖北省中医院骨伤科接受治疗的椎动脉型颈椎病患者从中医肝的角度辨证分型,选