【摘 要】
:
在深入分析传统数据挖掘方案已经不能满足大数据的挖掘任务的基础上,为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究。文中搭建了Hadoop云计算平
【基金项目】
:
广东省创新强校工程科研项目(粤教科函[2019]68号,项目编号:2018KQNCX393);2017年广东省教改项目(编号:粤教高函[2018]1号);2018年广州大学华软软件学院科研项目(ky201816,ky201809);2019年广州大学华软软件学院质量工程项目(JXTD201901)
论文部分内容阅读
在深入分析传统数据挖掘方案已经不能满足大数据的挖掘任务的基础上,为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究。文中搭建了Hadoop云计算平台的数据挖掘系统,对数据挖掘算法中聚类算法K-Means进行了设计,在Hadoop平台上实现了K-Means算法的优化,使用Hadoop分布式系统进行数据挖掘任务具有良好的效率,分析结果表明了其具有较大的潜力。
其他文献
目的 研究认知行为心理治疗在躯体形式障碍患者中的应用效果.方法 在我院2018年2月至2019年3月诊治的躯体形式障碍患者中选出146例为对象,随机数字表法分组:对照组患者给予常
近年我国城市洪涝灾害相当严重,国内城市洪涝灾害频繁地发生,直接影响城市安危和市民日常生活及生产。本文就洪涝灾害造成的危害,分析城市防洪排涝所存在问题,探讨解决问题的对策
对水能资源管理、水资源管理、水电管理之间的关系进行了分析,针对在水能资源管理方面存在的认识不到位、职责不明确、规划滞后、使用权管理缺位等问题,提出了改进措施和建议
叶尔羌河水能蕴藏量丰富,干流水能蕴藏量居新疆首位,水能开发具有一定的潜力,但目前开发利用程度较低。建立水能管理新体制、机制,加快水能规划开发,规范水能资源管理,促进水
随着我国海洋开发领域的日益拓展,港口的建设不断向大型化、深水化发展,施工规模和技术难度也不断增加。本文主要在分析了GPS-RTK定位系统的原理、系统构成及测量精度的基础上,阐述了如何运用GPS-RTK测量技术进行基床抛石定位、基床整平施工和水下抛石施工。
目的探究于慢性乙型肝炎病毒感染开展恩替卡韦治疗临床疗效观察及影响因素分析。方法本课题随机收集我院于2017年4月至2019年4月住院部收治的慢性乙型肝炎病毒感染患者62例作