基于Spark框架的聚类算法研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：hzzaa

【摘要】

：

大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark

【作者】

：

陈虹君

【机构】

：

电子科技大学成都学院

【出处】

：

电脑知识与技术

【发表日期】

：

2015年04期

【关键词】

：

大数据 Hadoop Spark 机器学习聚类 KMeans

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中的聚类算法KMeans,先分析了算法思想,再通过实验分析其应用的方法,然后通过实验结果分析其应用场景和不足。

其他文献

真空断路器投切电容器时的重燃过电压分析及预防措施

介绍真空断路器投切电容器时产生的过电压种类,采用PSCAD/EMTDC软件对真空断路器操作电容器时产生的重燃过电压进行仿真,分析过电压的产生机理,提出预防重燃过电压产生的有效

期刊

真空断路器电容器重燃过电压

征信体系建设中金融消费者权益保护工作思考

国际金融危机后,各国普遍加强了对金融消费者权益的保护,随着我国金融改革的不断深化,金融消费者与金融机构之间的各种矛盾和纠纷也日渐增多。作为现代金融体系运行的基石,征

期刊

征信体系建设金融消费者权益保护机制

古代皇帝谥号漫谈

古代皇帝在位时乾纲独断，皇帝死后，按照惯例要给他上“谥号”，而谥号有好有坏，给予的标准是他生前的功业德行。谥号是中国非常古老的制度，殷商时期似乎就有，如太甲等。町以十分确定

期刊

秦穆公开疆拓土周武王

近代铁路与中原地区农业经济发展探究——以1906-1937年间河南农业经济作物种植及贸易为例

1906至1937年间的中原地区,铁路兴起并迅速形成了交通运输网络。随着铁路运输网络的建成,中原地区铁路沿线及附近地区的区位优势得以彰显,某些高附加值的经济作物的品种改良

期刊

近代铁路经济作物中原地区新式交通体系

自然灾害对唐代地方官员的政治影响论略

唐代灾害频发,演变趋势呈现中前期相对较低、后期较高的特征,发生区域集中在政治、经济和军事中心。基层地方官员承担具体的救灾工作,务虚性的救灾行为较少。灾害奏报制度完

期刊

灾害史唐代地方官员灾异天谴论

矛盾过程中的正义斗争与社会和谐的关系探究

充满差异的社会生活难以杜绝各种矛盾的发生,矛盾一旦发生就难免引发冲突和斗争。而斗争方式有多种多样,但只有合理、合法、合道德的斗争,即维护公正平等与和谐统一进而扩展

期刊

矛盾正义的斗争科学发展社会和谐

电站锅炉高温腐蚀原理分析与防护

介绍电站锅炉容易发生高温腐蚀的部件及特征,分析这些部件发生高温腐蚀的原理和影响因素,并提出主要防护措施。

期刊

锅炉高温腐蚀腐蚀原理防护

卫星云图的三维重建及显示

虽然从气象卫星上接收到的数据中含有云层表面的高度信息,但目前人们仅用这些数据生成二维的图像来显示地面云层的分布情况。本文结合了计算机图形和图像处理技术,从中提出了

期刊

三维模型气象卫星云图小平面立体模型坐标系三维重建

解Navier-Stokes方程的弧长连续方法及最优控制算法

本文讨论了N—S方程的弧长连续方法及最优控制算法.在最优控制问题中,我们提出了相应于不可压的N—S方程的估值函数 J,且证明了J是一个多项式.

期刊

最优控制算法弧长连续方法N-S方程

我国大学变革中的组织行为学思考

20世纪90年代以来,我国强力推进的大学合并组建具有多方面的意义。但此次重大改革也带来了诸多问题,本文试图通过分析此次大学合并组建中不同的类型、不同的冲突、不同的个体

期刊

大学变革组织行为学理性思考

基于Spark框架的聚类算法研究

与本文相关的学术论文