基于Hadoop和Mahout的大数据管理分析系统

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:doudouling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量的爆炸性增长、数据结构的多样化和数据的流动性,传统的关系数据库系统已经无法满足大数据管理和分析的要求。因此有必要对基于大数据的数据管理和分析系统进行研究,以达到快速地统计和分析特定领域中海量结构化/非结构化数据,最终为决策提供支持的目的。提出一种基于Hadoop和Mahout的大数据管理分析系统。通过数据特性的分析,将数据分解后存入对应的数据库中进行管理。并在特定的应用领域中实现和验证了所提出的大数据管理分析系统,获得了优于已报道相关研究工作的数据分析结果。
其他文献
<正>两会期间有一则报道引起关注:北京大学女硕士苏黎杰毕业后在京城就业连连碰壁,最后作出一个"雷人"决定:回河南老家和农民工一道学习油漆技术。这件事似乎为两会前一则网
创新驱动战略的实施先要基于对区域创新现状的深入了解。自2006年山东省大力开展创新型省份建设以来,科技创新工作取得了一定进展。为更好地了解山东创新现状,为决策提供支撑
目的探讨不同疾病中血栓弹力图与凝血4项对凝血功能的一致性研究。方法选取2016年1月—2017年6月泰州市人民医院进行治疗的糖尿病、脑出血、肝硬化、骨折、宫颈癌患者283例,
中小制造企业是浙江经济发展的生力军,在国际金融危机影响下已陷入融资困境。为探寻机制性解决融资方案,通过选取部分企业进行调查研究,揭示了浙江中小制造企业融资困难的表
<正>食品安全关系国计民生,而"三鹿事件""双汇事件"等食品安全问题屡屡发生,让人触目惊心。怎样引导初中学生从化学角度了解食品安全呢?笔者带领学生开展了一次主题探究活动
<正>随着Internet技术得到持续快速的发展,网络应用也随之逐渐扩大,人们的日常生活更加离不开网络,从BBS到微博,从新闻站点到网购,人们不再满足于简单地从网络上获取信息,由
构建可持续发展的企业绩效评价指标的目的在于按照生态建设要求实现企业经济利益、环境与社会全面协调持续发展。通过对传统企业绩效评价体系的分析与评价,提出可持续发展的
在强制执行程序中关于预告登记的规定始终存在一个争议问题,即经预告登记后的不动产是不是存在限制或是对抗法院强制执行的效力,在理论方面及实务方面均没有相应的定论。因此
随着信息时代的迅猛发展,随之而来的是爆发式增长的大数据问题。信息抽取是从大量非结构化的文本中抽取出有价值的结构化信息,而关系抽取作为其中最重要的子任务,主要用于抽