基于MapReduce的分治k均值聚类方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:b479676614
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对原始k均值法在MapReduce建模中执行时间较长和聚类结果欠佳问题,提出一种基于MapReduce的分治k均值聚类方法。采取分治法处理大数据集,将所要处理的整个数据集拆分为较小的块并存储在每台机器的主存储器中;通过可用的机器传播,将数据集的每个块由其分配的机器独立地进行聚类;采用最小加权距离确定数据点应该被分配的类簇,判断收敛性。实验结果表明,与传统k均值聚类方法和流式k均值聚类方法相比,所提方法用时更短,结果更优。
其他文献
文章基于2009-2018年中国30个省(自治区、直辖市)的面板数据,考察了中国城镇化与农村绿色发展之间的区域空间关联特征,通过构建固定效应空间误差面板模型,系统地分析了城镇化
采用不同浓度的多效唑和丁酰肼对无患子进行叶面喷施处理,研究其对无患子生长的影响.结果表明:多效唑的矮化效果比丁酰肼好,其中0.01g/L多效唑和0.1g/L丁酰肼对无患子的矮化
我国在可持续发展观和“五大发展理念”的指导下,发展取得了长足的进步,但与此同时,我国也出现了一系列的生态环境问题,而生态不仅涉及单纯的环境保护更重要的是环境与经济的
追求实效性是思想政治教育的永恒主题。苏联在其存续的74年间积累了丰富的思想政治教育经验,创建了思想政治教育的“苏联模式”,对广大社会主义国家的思想政治教育活动产生深
针对恶意仿冒URL的有效识别问题,提出一种基于skip-gram和连续多层卷积层的模型相结合的网络模型完成对恶意仿冒URL进行特征提取并检测。根据URL结构特性将其切分为5个部分,
针对多径衰落信道条件下单载波调制信号识别效果较差的问题,提出一种基于高阶循环累积量的调制识别算法。根据多径衰落信道下循环累积量的稳健性以及不同循环累积量之间的差
随着教学环境的变化和教学发展的趋势,小学数学需要新的教学模式来丰富教学内容,解决教学中存在的问题。翻转课堂也被称为颠倒课堂,主要是对教学中的内化知识进行相应的转化,
针对传统入侵检测方法在检测效果上存在检测率低、误报率高等问题,将深度信念网络应用于入侵检测中,提出一种基于灰狼算法(GWO)的深度信念网络(DBN)入侵检测方法。对NSL-KDD
这是一片沉寂酣睡多年的土地/这是一个被现代遗忘的角落/这是一段被世人冷落的历史/这是一块未开垦的处女地/突然,有一天,地热将温泉高高喷出/泥土将芬芳豁然开启/复活,梨树
期刊