基于Hadoop平台的数据挖掘算法的研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:liyanfeiwoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深入分析传统数据挖掘方案已经不能满足大数据的挖掘任务的基础上,为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究。文中搭建了Hadoop云计算平台的数据挖掘系统,对数据挖掘算法中聚类算法K-Means进行了设计,在Hadoop平台上实现了K-Means算法的优化,使用Hadoop分布式系统进行数据挖掘任务具有良好的效率,分析结果表明了其具有较大的潜力。
其他文献
目的 研究认知行为心理治疗在躯体形式障碍患者中的应用效果.方法 在我院2018年2月至2019年3月诊治的躯体形式障碍患者中选出146例为对象,随机数字表法分组:对照组患者给予常
侧重介绍了邮区中心局生产成本事前控制的意义及相关方法,并着重对设备配置临界业务量的计算方法进行了详细论述。
近年我国城市洪涝灾害相当严重,国内城市洪涝灾害频繁地发生,直接影响城市安危和市民日常生活及生产。本文就洪涝灾害造成的危害,分析城市防洪排涝所存在问题,探讨解决问题的对策
阐述国内外UPS系统技术现状和发展趋势,讨论传统的双变换在线UPS系统存在的问题及解决办法,介绍单变换UPS系统,最后着重介绍Delta变换UPS系统。
对水能资源管理、水资源管理、水电管理之间的关系进行了分析,针对在水能资源管理方面存在的认识不到位、职责不明确、规划滞后、使用权管理缺位等问题,提出了改进措施和建议
叶尔羌河水能蕴藏量丰富,干流水能蕴藏量居新疆首位,水能开发具有一定的潜力,但目前开发利用程度较低。建立水能管理新体制、机制,加快水能规划开发,规范水能资源管理,促进水
鉴于建立在二层客户机/服务器结构的信息业务系统不能实现远程数据访问,提出了用三层客户机/服务器体系结构实现远程数据库交互的公用网关接口(CGI)和活动服务器页面(ASP)两种方案,并分析了
外部荷载和自身倾角对支架受力的影响分析十分复杂。在相同的外部荷载条件下,倾角的变化对光伏支架各构件的内力影响研究,能使设计人员更加准确掌握支架受力的薄弱环节,对光伏电
随着我国海洋开发领域的日益拓展,港口的建设不断向大型化、深水化发展,施工规模和技术难度也不断增加。本文主要在分析了GPS-RTK定位系统的原理、系统构成及测量精度的基础上,阐述了如何运用GPS-RTK测量技术进行基床抛石定位、基床整平施工和水下抛石施工。
目的探究于慢性乙型肝炎病毒感染开展恩替卡韦治疗临床疗效观察及影响因素分析。方法本课题随机收集我院于2017年4月至2019年4月住院部收治的慢性乙型肝炎病毒感染患者62例作