基于核心点的大数据谱聚类算法

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:yangliang0510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对谱聚类性能优异但因计算复杂度太高而无法应用于大数据的问题,提出一种将谱聚类应用于大数据的新算法.首先,基于数据相似性与随机抽样选取核心点集,并利用核心集对大数据分组;然后在核心集上应用谱聚类;最后综合核心集的聚类结果和数据的分组信息完成大数据聚类.该算法既将谱聚类推广到大数据,又通过核心点选取降低了噪声及异常数据的影响.实验充分验证了推广后的谱聚类应用于大数据的高效性.
其他文献
本文以十三矿主副井筒施工为例简要介绍了该施工设备、施工工艺、劳动组织、作业方式及管理措施。
利用批次吸附实验和等温滴定微量热技术(ITC)测定了碳纳米管(CNT)与腐殖酸(HA)相互作用的热力学参数,并研究了碳纳米管含氧量和离子强度的影响.批次吸附实验结果表明,碳纳米管与腐
近期宏观数据显示,GDP增速处于逐步下行阶段,而从大众消费品零售总额统计数据来看,多数行业均告别了20%以上的增长,预计这种情况未来可能成为一种常态。
利用国外心理学家罗姆瑟的事故现象模式,对某煤矿15年来所发生的煤矿伤亡事故进行统计分析,总结了事故发生的原因,提出了一些防范事故发生的措施,对拓宽当前煤矿安全管理思路具有
在前期持续上涨后,大盘在本周出现冲高回落,构筑阶段性顶部可能性大。从大盘未来一周的走向看,进一步调整的可能性较大,目标可能是尝试填补7月28日沪指2127的缺口,但估计在缺口上
本文总结了我局近几年来进行瓦斯抽放,确保煤矿安全高效高产所做一些技术和管理工作及所得成绩与经验。
SPPC项目对对撞机和高能物理发展有重大意义.作为SPPC注入器链的末端,SS环将质子能量从180GeV加速到2.1TeV,其性能与SPPC束流品质密切相关.为此初步探究了可用于SS环的Lattice结构
【正】 [中学数学]一张桌子有四条腿,当木匠把一张桌子做好后想检验桌子的腿是否能保证桌面平稳时,他只须将相对的两条腿的顶端拉条线,另外两个相对的腿的顶端也拉条线,如果
广东依顿电子科技股份有限公司(下称“依顿电子”)是一家以高精度、高密度双层及多层印刷线路板的制造和销售为主营业务的公司。为客户提供“一站式”生产服务,即由印刷线路板线路设计优化、小批量样板生产、批量生产和售后服务等构成的综合服务体系。  最大印刷线路板生产基地  据悉,2006年,中国大陆首次超越日本,成为全球第一大PCB(印刷线路板)制造基地,尔后连续多年移居首位。2012年,全球PCB总产值5