一种基于抽样改进加权核K-means的大数据谱聚类算法

来源 :测绘通报 | 被引量 : 0次 | 上传用户:hrk303968324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的数据规模及对原始数据类别的覆盖,通过抽样子集内加权核K-means迭代优化,避免Laplacian矩阵特征分解的大量资源占用,从而以部分核矩阵的使用避免全部核矩的时间、空间复杂度。试验结果表明,改进算法在保持与经典算法相近聚类精度基础上,大幅提高了聚类效率。
其他文献
随着信息技术的不断发展及在教育领域的深入应用,不少国家和地区都不断加大教育科研网的建设力度,并使其成为该国/地区的教育科研基础设施重要组成部分。关于世界各国教育科研
经费剧增、采购编目语种扩充、人手短缺等问题对我馆采编工作提出了挑战,采编工作优化势在必行。本文从人员配置优化、合理的工作流程、定额定量管理等方面提出了优化方式。
俄亥俄州的学术图书馆联盟的成员很快就可以添加一种强大的搜索工具,以改善搜索能力,帮助用户获取他们所需要的信息。所谓“发现层”是指图书馆的读者把各种来源(书籍、印刷型期
<正>目前,国内关于服刑人员心理适应方面的干预研究甚少,关注新人监这个阶段服刑人员的心理方面的研究就更少。~①从新人监人员的心理特征可以看出,这类人员有一些共同的适应
期刊
输入类的隐私威胁,是移动平台隐私威胁的重灾区。目前的方法很难有效地保护用户输入的隐私,核心困难在于它没有办法系统化地识别哪些隐私数据是用户输入的隐私。移动平台上,
不同的人口特征,在一定程度上影响着经济发展的态势与变化。中国"未富先老"的现实国情,使2013年中国人口红利消失的标志性年份与2004年中国到达刘易斯转折点的标志性年份这个
随着IT技术的快速发展,特别是近几年深度学习、人工智能应用的兴起,越来越多的客户还是对数据的传输速度、对延迟产生了越来越高的需求。作为一家以lnfiniBand网络起家的公司,Me
结合一些工作经验,论述了多层住宅建筑给排水设计中给水管材的选用、管道的敷设方式、卫生间器具的布置、水表出户设置、空调冷凝水排放以及家用热水器管道设置的等方面的施
一直以来,高校的云服务、云计算、大数据,都处在“云山雾罩”的朦胧状态,难免“人云亦云”,甚至是“新瓶装旧酒”,本期我刊重点围绕当前高校云服务的四个热点问题,邀请国内高校权