基于相似度矩阵的K-Means算法的MapReduce并行化实现

来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:akgmtgdt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高基于相似度矩阵的K-Means算法(SMK-means)处理大数据的能力,它使用MapReduce分布式编程模型,并结合SMK-means算法自身的特点,设计出了SMK-means算法基于MapReduce的并行化实现。通过设计Map和Reduce函数实现了SMK-means算法的并行化。Map函数通过计算样本和聚簇中心的相似度来确定样本的聚簇归属,Reduce函数用于完成聚簇中心的计算。实验结果证明,基于MapReduce的并行化的SMK-means算法在保证文本挖掘性能不降的前提下,使得运行效
其他文献
为适应社会的发展,教育也在不断的改革。针对小学生的数学教育,教育者还需要考虑小学生的自身特点,将数学内容有趣化,以激发学生的学习兴趣,提高学生的学习积极性。为提高小
小组合作学习是一种富有创意的教学方式,它是利用一组动态的因素引导学生互动、学习,保证学生为了集体荣誉努力学习、团结同学、相互协作,完成教师交给的学习任务。结合教学
查教授说:“境外市场零售油价比中国的要高,那么出口也就不是中方政府所能控制,也是正常现象。但由于中石化、中石油在国内成品油销售中处于垄断地位,它们在控制出口方面有道义上
对很多人来说,管理并不是一件轻松的事情,那些晦涩难懂的管理理论和方法,更是令人望而却步。事实上,在管理的百花园里,有一些寓繁于简的管理黄金法则,朴实无华,简单实用.影响着一代又
2007年2月13-21日,“哈里斯互动调查顾问公司”(Harris Interactive)代表IBM公司在网上对年龄在18岁及以上的1064名美国成年人和612名英国成年人进行了一项调查。调查工作首先是根据在家庭内所承担的日用品采购责任度,将受访者归类为决策者(grocery decision makers),然后又对美国受访者的年龄、性别、种族、地区、教育和收入数字以及英国受访者的年龄、性别
初等教育师范生课堂教学技能训练具有个体差异性。在训练时应该根据师范生的个性特点进行精准化训练。可以从训练目标、训练方法和评价方式等方面确入手,确保训练的精准化。
应用题教学是小学数学教学的重要组成部分,是小学数学教学的重中之重,也是教学的难点。
二手房作为房地产税源中不可缺少的部分,随着二手房交易市场的不断成长和壮大,二手房交易税收占房地产业税收的比重也越来越大。
在复杂教学需求的条件下,一些院校对实验教学环节的管理方式还比较粗放。主要表现在安排实验课程的自动化能力不强、没有实现对实验教学运行情况的有效监控与管理、没有实现
经济型连锁酒店的管理,核心就在于对“住宿”和“标准化”的关注。      经济型酒店,也被人们称为有限服务酒店,最早于上世纪70年代出现和成型于美国速八(SUPER8)模式。经济型酒店只专注于酒店消费的核心──住宿和早餐,因此也有人将经济型酒店称为“B&B”,即“床铺(Bed)+早餐(Breakfast)”。在美国,经济型酒店占到整个市场70%的份额。经济型酒店之所以“经济”就在于取消或者压缩了餐