基于MapReduce和Spark的大数据主动学习比较研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:qcxmh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗费4个方面进行了比较研究,得出了一些有价值的结论,这些结论将为相关研究人员提供很好的帮助。
其他文献
目的探讨小檗碱预防家兔颈动脉粥样硬化形成的作用机制。方法将24只大白兔随机分为正常对照组、模型组和小檗碱组。正常对照组给予普通饮食,模型组和小檗碱组给予高脂饲料喂养
目的了解新疆乌鲁木齐市维吾尔族居民胰岛素抵抗的患病率并分析其相关因素。方法采用整群抽样方法调查乌鲁木齐市居住5年以上的维吾尔族居民967人,测量身高、体重、腰围、臀围
GPU已被广泛应用于当前的高性能计算系统中,但其性能却受到程序运行时不同控制流方向的严重制约。这一问题通常通过动态Warp重组技术来解决,即将一个或多个Warp内沿相同控制
目的通过研究餐后高甘油三酯血症与血管内皮依赖性舒张功能、血管活性物质一氧化氮和颈动脉内一中膜厚度之间的关系,探讨老年糖尿病人餐后脂代谢紊乱对血管内皮功能的影响。方
目的 观察厄贝沙坦对大鼠心肌梗死后晚期心室重构及心功能的影响。方法 结扎大鼠左前降支建立急性心肌梗死模型,将17只术后24h仍存活的大鼠随机分为对照组(n=8)和厄贝沙坦组(n=9),
目的:比较异基因脾细胞经受体门静脉和口服两种途径输注诱导免疫耐受的效果。方法 将供体SD大鼠的脾细胞经门静脉或经口服途径输注给受体Wistar大鼠,1周后把SD大鼠的皮肤移植到
<正> 地处长江之滨的浒浦镇是常熟市10大建制镇之一,也是常熟市最大的对外港口。多年来,浒浦镇在发展经济的同时,重视环境综合整治,实现了经济建设、城乡建设和环境建设同步
缺血再灌注损伤(ischemia reperfusion injury,IRI)是组织器官发生缺血后血流再灌注加重存活的缺血组织功能障碍和结构损伤的现象,由Sewell在1955年结扎狗冠状动脉后首先发现,并在
目的研究在中国北方汉族人群中抵抗素基因5’末端启动子区g-420 C〉G多态性与高血压发病年龄的相关性。方法选取高血压病组121例,其中年龄〈40岁的43例,年龄≥40岁的78例,对