一种基于Hadoop平台的新聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tony33334444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有很多聚类算法不能有效处理大规模数据的问题,基于微簇和等价连接关系,提出一种能在Hadoop平台实现高效并行化的聚类算法bigKClustering.算法将紧凑的数据抽象成一个向量,然后通过等价关系对这些向量进行连接,得到最终的聚类结果.实验结果表明,bigKClustering算法不仅具有良好的时间效率和聚类效果,而且具有良好的可伸缩性、加速比和时间稳定性.
其他文献
进入二十一世纪后,随着改革的不断深化,原隶属国务院各部委的几百家行业技术归口研究所(以下简称研究所)纷纷转制为科技型企业或被直接并入中央或地方的有关企业集团。尽管经历了
期刊
安全起爆系统对于工程爆破是极为重要的.本文综述了国内外工程爆破安全起爆系统的发展,介绍了三种非电起爆系统和三种遥控起爆系统的原理、结构和性能特点,指出了存在的问题
现代企业档案管理工作是企业管理的重要基础工作之一,对企业生产经营和各项管理工作都会产生直接或间接的影响,在企业文化建设中的作用也是多方面的。
原国家经贸委、中央企业工委两个全宗的档案由国资委保密档案处代管,按照中央档案馆规定应予整理上交。2007年经国资委批准,由机械工业档案馆承担整理上交任务。自2008年初至20
目前分簇无线传感器网络的节点信誉管理方案存在信誉值计算、更新及维护代价高,节点抗恶意哄抬及恶意抵毁能力弱等问题.将无线传感器节点分为簇头节点和普通传感器节点,将两
在无线传感器网络(Wireless Sensor Network,WSN)中,节点信任评价作为传统的基于加密的安全体系的补充手段,可用于识别恶意节点并处理来自网络内部的攻击。针对用于数据采集
档案人员的综合素质是指档案工作者在岗位上所必须具备的知识、技能及各种基本素养等的总和。概括地说就是从事档案工作必须具备的基础知识、基本技能、政治素养、道德素养、
IPv6/IPv4共存环境下多址同源识别是共存网络管理与拓扑发现的一个关键问题.现有研究主要集中于子网内部的双栈发现及单一IP协议栈中的别名解析,难以识别远程IPv6/IPv4共存网