基于相似度矩阵的K-Means算法的MapReduce并行化实现

来源 :电脑知识与技术：学术交流 | 被引量 : 0次 | 上传用户：akgmtgdt

【摘要】

：

为了提高基于相似度矩阵的K-Means算法(SMK-means)处理大数据的能力,它使用MapReduce分布式编程模型,并结合SMK-means算法自身的特点,设计出了SMK-means算法基于MapReduce的

【作者】

：

曹奇敏刘鸿霞

【机构】

：

中国政法大学图书馆

【出处】

：

电脑知识与技术：学术交流

【发表日期】

：

2017年6X期

【关键词】

：

K-MEANS算法相似度矩阵 MAPREDUCE模型并行计算文本挖掘 K-means algorithm similarity matrix MapR

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了提高基于相似度矩阵的K-Means算法(SMK-means)处理大数据的能力,它使用MapReduce分布式编程模型,并结合SMK-means算法自身的特点,设计出了SMK-means算法基于MapReduce的并行化实现。通过设计Map和Reduce函数实现了SMK-means算法的并行化。Map函数通过计算样本和聚簇中心的相似度来确定样本的聚簇归属,Reduce函数用于完成聚簇中心的计算。实验结果证明,基于MapReduce的并行化的SMK-means算法在保证文本挖掘性能不降的前提下,使得运行效

其他文献

小学数学教学中游戏化教学的应用探究

为适应社会的发展,教育也在不断的改革。针对小学生的数学教育,教育者还需要考虑小学生的自身特点,将数学内容有趣化,以激发学生的学习兴趣,提高学生的学习积极性。为提高小

期刊

有趣化游戏化教学

初中语文教学中小组合作学习的优化策略

小组合作学习是一种富有创意的教学方式,它是利用一组动态的因素引导学生互动、学习,保证学生为了集体荣誉努力学习、团结同学、相互协作,完成教师交给的学习任务。结合教学

期刊

初中教育语文教学合作教学

换一种观念看石油——访北京大学国际关系学院教授、石油能源安全问题专家查道炯

查教授说：“境外市场零售油价比中国的要高，那么出口也就不是中方政府所能控制，也是正常现象。但由于中石化、中石油在国内成品油销售中处于垄断地位，它们在控制出口方面有道义上

期刊

石油能源国际关系北京大学安全问题学院专家成品油销售市场零售

管理的黄金法则

对很多人来说，管理并不是一件轻松的事情，那些晦涩难懂的管理理论和方法，更是令人望而却步。事实上，在管理的百花园里，有一些寓繁于简的管理黄金法则，朴实无华，简单实用．影响着一代又

期刊

管理理论黄金法则管理者企业家

增加透明度　重建信任感

2007年2月13-21日，“哈里斯互动调查顾问公司”（Harris Interactive）代表IBM公司在网上对年龄在18岁及以上的1064名美国成年人和612名英国成年人进行了一项调查。调查工作首先是根据在家庭内所承担的日用品采购责任度，将受访者归类为决策者（grocery decision makers），然后又对美国受访者的年龄、性别、种族、地区、教育和收入数字以及英国受访者的年龄、性别

期刊

信任感透明度IBM公司顾问公司成年人哈里斯

初等教育师范生课堂教学技能精准化训练对策研究

初等教育师范生课堂教学技能训练具有个体差异性。在训练时应该根据师范生的个性特点进行精准化训练。可以从训练目标、训练方法和评价方式等方面确入手,确保训练的精准化。

期刊

师范生课堂教学技能精准化训练

浅谈小学数学应用题教学的几个问题

应用题教学是小学数学教学的重要组成部分,是小学数学教学的重中之重,也是教学的难点。

期刊

应用题教学审题解题过程

浅析镇雄县二手房交易税收的征管现状及应对措施

二手房作为房地产税源中不可缺少的部分，随着二手房交易市场的不断成长和壮大，二手房交易税收占房地产业税收的比重也越来越大。

期刊

二手房交易税收房地产

对实验教学环节进行科学调度与精细化管理的有益尝试

在复杂教学需求的条件下,一些院校对实验教学环节的管理方式还比较粗放。主要表现在安排实验课程的自动化能力不强、没有实现对实验教学运行情况的有效监控与管理、没有实现

期刊

实验教学科学调度精细化动态化数据可视化管理experimental teaching The science dispatch Fine mana

“如家”经济型的经营谋略

经济型连锁酒店的管理，核心就在于对“住宿”和“标准化”的关注。　　　　　　经济型酒店，也被人们称为有限服务酒店，最早于上世纪70年代出现和成型于美国速八（SUPER8）模式。经济型酒店只专注于酒店消费的核心──住宿和早餐，因此也有人将经济型酒店称为“B&B”，即“床铺（Bed）+早餐（Breakfast）”。在美国，经济型酒店占到整个市场70%的份额。经济型酒店之所以“经济”就在于取消或者压缩了餐

期刊

经济型酒店经营谋略70年代美国早餐消费市场

基于相似度矩阵的K-Means算法的MapReduce并行化实现

与本文相关的学术论文