分布式K-means聚类算法研究与实现

来源 :软件 | 被引量 : 0次 | 上传用户:tsao8883
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网数据的指数级增长,传统的聚类算法面临许多新的问题和挑战。本文深入研究了基于Hadoop的分布式K-means聚类算法,给出了算法的设计方法和实现策略。在5个不同大小的数据集上的实验表明,与传统的K-means聚类算法相比,本文设计的算法具有较好的性能,可有效地应用于海量数据的分析和挖掘。
其他文献
案情:黄某原是某私营公司职工,负责结算、收取公司与外单位之间的货款。2015年6月的一天,黄某趁公司财务室无人之机,撬锁窃得4万元货款欠条1张。当年7月初黄某辞职,当月底持欠条到
报纸
[摘 要]在古诗词教学中注重作品意识的渗透,既是对古诗词作品的一种认可,又能启蒙学生的文学意识,为学生一生的发展奠基。教师可通过诵读、思辨、创作等形式展开教学,从而使学生喜欢上古诗词,喜欢上创作,最终提升学生的文化素养。  [关键词]小学语文;古诗教学;作品意识  [中图分类号] G623.2 [文献标识码] A [文章编号] 1007-9068(2020)24-0003-01  古诗词是我国
通过问卷调查分析离散数学教学中存在的问题,根据“微创新”中以用户为中心、从微小处进行改进来提高产品质量的理念,提出离散数学教学过程中教学准备、第一堂课、课堂气氛、作
针对我校学生在《高分子材料研究方法》课程学习中出现的自主学习能力、知识运用能力及综合分析能力较差等问题,基于“以成果为导向”、“以学生为中心”和“持续改进”理念,
《环境、安全与健康工程》是一门综合性较强的安全工程专业基础课程,由于课程内容庞杂、标准条款较多,传统以教师理论讲授为主的教学模式,忽视学生实践能力的培养,从而影响教
RBPF是一种有效解决同时定位和建图的算法。传统的RBPF算法使用的粒子数目多并且频繁地执行重采样,导致粒子退化且估计能力下降,从而构建的栅格地图精度不高。针对上述缺点,对RBPF提出优化,首先将机器人的运动模型与观测模型结合作为其混合提议分布,同时利用退火参数优化混合提议分布,调控两者在提议分布中的比例,使其更加精确;其次在重采样过程中根据粒子的权值对其进行分类,对高权重以及低权重粒子引入自适应
在习近平总书记全面建成小康社会,坚决打赢脱贫攻坚战,确保到2020年所有贫困地区和贫困人口一道迈入全面小康社会的号召下,研究并解决好草原牧区贫困问题不仅有助于掌握草原
以红薯叶为主要原料,添加适量的猕猴桃汁及其它辅料,研制出营养丰富、风味良好、具有一定保健作用的红薯叶果汁复合饮料。并对红薯叶提取液进行脱苦研究,加苦味掩蔽剂β-环糊
目的:观察品管圈活动在糖尿病护理风险管理中的应用效果。方法:将在2012年12月到2015年11月间在我院接受长期治疗的109例糖尿病患者为研究对象,采取品管圈活动护理方法进行治