基于RHadoop搭建大数据统计分析平台

来源 :科技创新与应用 | 被引量 : 0次 | 上传用户:good2009good
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop是当前非常流行的大数据分布式处理基础架构,通过HDFS和Mapredue实现了对海量数据的高速运算和存储。R软件是具有完善数据统计分析功能且被广泛使用的开源系统。文章叙述了基于R和Hadoop构建大数据统计分析平台的过程,藉此实现对大数据的统计分析。
其他文献
随着我国城镇化的快速推进,城市不断扩张,大片市郊农村被纳入城市体系,这些地区相继经历了拆迁、建设的过程,与之伴随的是形成了越来越多的拆迁安置社区,以及大量的农村失地
<正>不止步于大数据下的移动电商,服装类应用明星衣橱正进入产品定制新领地采访开始后的前二十分钟,林清华连续接听了四五个电话。国内首档明星跨界时尚真人秀节目《女神的新
作为与政府组织、企业组织相区别的社会组织即社会第三方,在社会定位重新调整和社会作用逐步提高的过程中,要想成为真正独立发挥作用的社会力量,就应该形成自己的文化。第三
2012年8月31日修改的《民事诉讼法》新增了行为保全制度,填补了以行为给付为保全对象的法律空白。但是,本次修改所涉及行为保全的规定均显得过于原则。其中,行为保全的审理程
<正>活着,是电商当下最幸福的事。泡沫最凶的时候,一个普通经理敢要价月薪6万,这种金钱游戏谁还玩得起?当浮华褪去,神马流量、转化率都是浮云,你手里的现金才是上帝。这半年
自2009年10月,温家宝在哥本哈根会议上承诺我国在2020年单位GDP的GHG的排放量将会降低40%~45%之后,碳排放指标就被纳入了“十二五”规划,同时我国各种政策也更多地落向了碳减
近些年来,出现了不少令公众哗然的冤假错案。一方面,冤假错案的产生是由多方面的复杂因素导致的;另一方面,尽管新修改的刑事诉讼法已经有了许多进步,但作为统领整个刑事诉讼
<正>同一公司旗下产品,美图秀秀图片工具,美拍负责短视频社交2013年初,当Twitter率先推出短视频应用Vine时,业界纷纷认为这将催生下一个百亿美元的市场。与此同时,新浪、腾讯
目的:研究SLC2A9基因单核苷酸多态性位点rs1014290与帕金森病(PD)的关系以及该位点基因型与尿酸水平的相关性。方法:采用病例-对照研究,病例组为2011至2013年之间就诊于苏州
城市边缘区是城市向乡村过渡的地带,是城市化最直接、最敏感的地区。本文以江苏的南京、常州、镇江等城市为例,论述城市边缘区的基本概念,以及城市边缘区的空间结构特征和动态演