基于MapReduce模型的并行遗传k-means聚类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:pc00000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高遗传k-means算法时间效率和聚类结果的正确率,利用遗传算法的粗粒度并行化设计思想,提出了在Hadoop平台下将遗传k-means算法进行并行化设计。将各个子种群编号作为个体区分,个体所包含的各个聚类中心和其适应度作为值共同作为个体的输入;在并行化过程中,设计了较优的种群迁移策略来避免早熟现象的发生。实验对不同的数据集进行处理,实验结果表明,并行化的遗传k-means算法在处理较大数据集时比传统的串行算法在时间上和最后的结果上都具有明显的优越性。
其他文献
目的:探讨磁共振3D-B-FFE和3D-TOF序列联合应用对血管压迫性三叉神经痛的诊断价值。方法:对58例血管压迫性三叉神经痛的患者均使用磁共振3D-B-FFE和3D-TOF序列进行三叉神经脑
介绍了共同沟及其法规在国内外发展的情况,着重分析了共同沟潜在的经济效益和社会效益以及政府在共同沟建设中的作用,提出了共同沟建设的建议。指出只有提高对共同沟的认识,
目的:探讨无痛胃肠镜与常规胃肠镜的临床应用效果。方法:收治疑似胃肠疾病患者99例,分别采取无痛胶囊内镜以及常规双气囊胃肠镜进行检查,观察2种诊断方法的诊断效果。结果:99
探讨原始音乐教育现象,必然涉及到音乐的起源、教育的起源、原始音乐教育意识的萌发、音乐教育的表现形态等问题。搞清这些问题,不但对于完善中国音乐教育史学科建设有着积极
基于RFID技术,提出了一种贯穿供应链全过程的物流信息跟踪系统模型,为多种用户提供物流信息跟踪平台。根据模型构建了物流信息跟踪系统,对系统的基本工作过程进行了设计。针
恩施转丧道场台本《瑜伽取经道场》、《佛门取经道场》是已发现的为数不多的西游宝卷;经过详细的文本解析,这两部宝卷可与桂西魔公教的《佛门取经道场·科书卷》相互补充阐释
数学教学过程中导致交流出现障碍的因素主要包括:教师、学生、信息交流、信息载体和教学环境。通过对主要障碍进行分析,寻求有效的教学对策,能使数学课堂交流达到以下目标:促
本文研究平行六边形区域上的非均匀节点离散傅立叶变换的快速算法及其实现.首先在晶格(Lattice)的框架下建立了平行六边形区域上的非均匀节点离散傅立叶变换(NDFTH).在此基础
概括了中俄贸易发展呈现出的新特点,包括中俄双边贸易的出现的新变化、中俄相互投资领域的新趋势、中俄边境贸易制度的调整;论述了中俄经贸关系发展的新机遇,包括双边政治互
在整个中学教学中,语文是很重要科目之一,中学语文无论是在考试的比重上还是在日常生活的应用上都显得尤为重要。提高中学语文教学质量是很必要的,中学语文是一种依附于感悟