基于密度峰值优化的Canopy-Kmeans并行算法

来源 :通信技术 | 被引量 : 0次 | 上传用户:dzxt720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据规模的爆炸式增长,利用K-means等聚类算法挖掘大数据的潜在价值,已成为一个当前较为重要的研究方向。将Canopy算法与K-means算法结合,可解决K个中心点的选取问题。而针对Canopy-Kmeans算法中初始中心点选取随机、算法受噪声点影响等问题,提出了一种利用密度峰值改进的M-Canopy-Kmeans算法,并采用Spark框架实现算法的并行化。实验结果表明,改进后的算法避免了Canopy中心点选取的盲目性,且有效排除了样本中的噪声点,准确性、抗噪性都有明显提高,且在Spark并行框架中具有良好的加速比和扩展性。
其他文献
企业20%的核心人才创造80%的绩效,留住核心员工才能保证企业的长远发展。本文通过分析我国中小企业核心人才流失问题的现状和原因,从而提出以下对策:优厚的薪资,良好的发展空
酒是李清照诗词创作的灵感,是她情感的寄托,坎坷的一生只有酒与她相依相伴。在酒的这份特殊的兴奋剂的作用下我们看到了其沉醉于大自然而不愿被束缚的精神和张扬个性、挥洒人
目前我国存在着大量抗震设防、抗震性能欠佳的建筑物,为了能够确保这些建筑安全使用并发挥其应有的建筑功能,要对其进行抗震鉴定及加固。本文分析了我国建筑物的抗震加固技术方
目的 :探讨和研究扩张性心肌病的彩色多普勒超声心动图的诊断要点。方法 :收集近三年来我科通过彩色多普勒超声心动图诊断的典型扩张性心肌病患者 5 3例进行分析和归纳 ,寻找
改革开放以来,我国区域经济差距呈现不断扩大的趋势。面对区域差距,新古典主义学派与循环累积增长学派之间存在自由放任与政府干预之争。文章认为尽管市场存在某种自发的区域
本文对熊耳山地区蚀变构造岩型金矿成矿模式和成因进行了探讨。
<正>当众筹遇上青虾,物联网遇上大棚,这种看似新奇的搭配会产生怎样的化学效应呢?泗阳——中国青虾之乡,青虾的养殖对水质要求很高,一级水质才行,用50度以上的酒泡青虾,做成
随着生态文明建设的不断推进,生态道德教育公众参与问题日益引起学术界关注,取得了一定的研究成果。文章从现状出发,系统总结了现有研究成果,分析了研究中存在的薄弱环节,展
近日,记者接到家住北京延庆的王先生电话称,延庆城区有纯电动出租车在拉活。但位于交通局附近的电动车充电站却拒绝访客,十分神秘,就连开这些电动车的司机也被公司要求不能随便谈
<正>"西域"是一个历史地理概念,所谓"西域",通常是对阳关、玉门关以西广大地区的统称,但这一概念的内涵有广义和狭义之分,并且不同历史时期的"西域"所指的地理范围也不尽相同