基于MapReduce和并行遗传算法的大数据聚类问题研究

来源 :鲁东大学学报(自然科学版) | 被引量 : 0次 | 上传用户:zheng829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是将不同对象的集合分割为由相似对象组成的多个不同类的过程,是最重要的数据挖掘技术之一.然而,对于大数据聚类却是一个复杂的问题.由于大数据体量庞大,聚类算法时间消耗巨大.并行是解决算力不足的一个非常好的方法.据此,本文采用了Hadoop平台上的MapReduce来实现大规模数据集的并行运算,将大数据聚类问题的时间复杂度限制到一个可以接受的范围内.最后本文从时间消耗和聚类精确度方面对该方法的性能收益进行了评估,在保证较高精确度的同时大大提高了运算速度.
其他文献
"活性"/可控自由基聚合(CRP)具有精密调控聚合物的组成和结构的重要特征.有机磷化学与生命息息相关,已经成为聚合反应一类重要分支.随着研究的深入,其中有机磷类化合物也可在CRP
研究了测度链上的二阶边值问题,解决了换元积分和格林函数对称形式构造中的困难,运用迭代技巧,得到了对称正解存在的充要条件,并举例验证了结果.
1999年初由中国电信总局和国家有关部委的信息主管部门共同倡议发起的"政府上网工程"在我国引发了一场规模空前的政府信息化普及活动,大大提高了各级政府部门的信息化意识,有