基于MapReduce的并行MRACO-PAM聚类算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:aiyanxiyanxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据处理算法中常用的方法,PAM算法自提出以来便成为了最常使用的聚类算法之一。虽然传统PAM算法解决了K-Means算法在聚类过程中对脏数据敏感的问题,但是传统PAM算法存在收敛速度慢、处理大数据集效率不高等问题。针对这些问题,利用蚁群搜索机制来增强PAM算法的全局搜索能力和局部探索能力,并基于MapReduce并行编程框架提出MRACO-PAM算法来实现并行化计算,并进行实验。实验结果表明,基于MapReduce框架的并行MRACO-PAM聚类算法的收敛速度得到了改善,具备处理大规模数据的能力
其他文献
为提高无线网络抗污染攻击性能,提出一种基于消息认证混合同态签名的无线网络抗污染攻击方案。首先,采用有向多重图的源节点、非源节点集和链路集对无线网络编码过程进行模型
为了提高无线传感器网络的定位精度,在Grid-Scan算法的基础上提出一种改进的二次栅格扫描定位算法,再利用三角形质心迭代法进一步提升定位精度。首先通过比较未知节点的所有
气象资料归档和检索系统(MARS)实现了气象科学数据包括数值预报产品的归档和检索管理。但是,随着精细化数值预报技术的提高,MARS系统管理的气象科学数据呈海量增长趋势,对归档
2018年10月14日-16日青岛由中国计算机学会主办、中国计算机学会高性能计算专业委员会、青岛海洋科学与技术国家实验室、国家超级计算济南中心共同承办、北京并行科技股份有限公司协办的"2018年全国高性能计算学术年会(HPC CHINA 2018)"将于2018年10月14日-16日在山东青岛召开。全国高性能计算学术年会是中国一年一度高性能计算领域的盛会,
随着网络用户的数量持续增多和对安全需求的增长,以AES加密的方式对用户数据流进行加密保护得到了广泛的应用。对服务器而言,大量用户形成的数据流具有流速高和突发性强的特
部署异构网络是提高移动通信系统容量至关重要的举措。然而宏基站的高发射功率会使得微蜂窝边缘用户受到严重的干扰;同时,微蜂窝周围的宏蜂窝用户由于靠近微基站将同样受到其
布尔可满足性SAT问题作为第一个被证明的NP完全问题,是计算机理论与应用的核心问题,有着重要的应用价值,因此近年来涌现了各种各样SAT求解器。但是,SAT求解器的运算效率始终
为了达到提高颗粒流体动力学方法GHM计算效率的目标,分析了GHM模型的主要计算模块,抽取其中的可并行计算模块,基于多核计算机的硬件环境,应用OpenMP多线程并行计算模型,对采用数值
随着大数据的发展,Hadoop系统成为了大数据处理中的重要工具之一。在实际应用中,Hadoop的I/O操作制约系统性能的提升。通常Hadoop系统通过软件压缩数据来减少I/O操作,但是软件压缩