基于Spark平台的大数据挖掘技术研究

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:feifeichongwx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据具备数据量大、富于多样性的特点.因此在大数据分析方面,无论是对处理速度还是实时性都具有较高的要求.数据挖掘技术是从海量数据里采用某种建模算法,用来寻找隐藏在数据背后的信息,从而让大数据产生更大的价值.Spark框架是一个针对超大数据集合的低延迟的集群分布式计算系统.本文基于该框架,对大数据挖掘技术进行了具体研究,首先完成了基于Yarn部署上Spark集群搭建,然后提出并实现了并行Apriori算法,该算法成功补充了Spark MLlib分布式机器学习库中所缺乏的关联分析问题的分布式算法.“,”Because big data have the characteristics of large amount of data and rich diversity,it must be demanding large data analysis both in processing speed and real-time requirements.Data mining technology is to use some modeling algorithm from massive data,to look for hidden information behind the data,so that big data can produce greater value.Spark framework is a low latency cluster distributed computing system for super large data sets.Based on the framework,this paper studies the big data mining technology.This paper designs and implements the Yarn deployment on the Spark cluster firstly,and then proposes and implements parallel Apriori algorithm.This algorithm successfully adds to the distributed algorithm of association analysis by the lack of Spark MLlib distributed machine learning repository.
其他文献
不少女性每到每个月的某几天就会焦躁不已,痛经让她们坐立不安,甚至让她们正常的工作和生活都无法进行.对饱受痛经折磨的女性而言,如何能缓解痛经是她们最关心的问题之一.月
期刊
凝血因子V(coagulation factor V,FV)在凝血过程中是重要的辅助因子,其基因中一个点突变1691G→A,使它对抗凝血系统中的一种血浆蛋白质C(APC)的失活作用产生抗性,使血栓发生
水肿体质,指容易水肿的一种体质的泛称.如果你早上起来好好的,下午的时候,小腿尤其是脚踝部分开始变粗变肿,就像“猪蹄”,按一下还会“弹”回去,多半就是水肿体质.身体会水肿
期刊
锥子脸人人都想拥有,那么圆脸饼脸的你应该怎么做才会有锥子脸呢?下面我们就来说说应该如何瘦脸.rn坚持刮痧可减肥rn身体经络一旦不通,污物就会堆积阻塞,流速变慢的血液在皮
期刊
电脑已成为我们生活的一部分,办公、休闲、娱乐都离不开它.便利之余,也让我们的皮肤出现:粗糙、毛孔变大、辐射斑、暗黄等问题,电脑辐射会加速皮肤老化,已成不争的事实.我们
期刊
1、增强你的核心肌群,提高你的运动能力rn平板支撑主要锻炼核心肌群,包括腹横肌、腹斜肌、腹直肌,还有臀部肌肉.通过做平板支撑,你可以加强这些肌肉.当这些肌肉得到加强后,你
期刊
随着年纪的增长,老人的抵抗力下降,很容易就出现便秘的症状,老人便秘的话可以多吃一些清理肠胃的食物,下面就为你介绍一些预防老人便秘的食疗.rn为什么会便秘rn1、气血不足因
期刊
图书馆由原来的传统图书馆逐步发展为数字图书馆、智能图书馆、智慧图书馆。目前RFID射频技术应用在图书馆中,是图书馆逐步由数字图书馆升级为智能图书馆迈出的非常重要的一步。
期刊
木耳具有预防心血管疾病等等功效,所以是各类人群都可以多吃的食物.在这里,想要提醒大家的是木耳一定要搭配正确才行,否则就不能发挥木耳的这些功效了.那么,就快来一起看看木
期刊