密度峰值优化初始中心的K-medoids聚类算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:song0719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。
其他文献
<正>一、鼻解剖结构1.鼻窦是鼻腔周围颅骨中的一些含气空腔,共有4对,包括额窦、上颌窦、筛窦及蝶窦。1.1额窦位于额骨内外两层骨板之间,左右各一,其大小、形态极不一致。可一
会议
教师将化归思想教学纳入高中函数教学中,并培养学生的化归思想,有利于学生解决数学中的函数问题。本文通过对化归思想的简述,分析了转化未知问题为已知问题、转换正面问题和
1911年10月28日,正当武昌起义的革命军民与清军浴血奋战、终因兵力悬殊而情况危急之际,革命元勋、屡屡指挥武装起义的黄兴,辗转抵达武昌,湖北军政府特制一面&#39;黄兴到&#39;
随着新课程改革的不断推进,在小学品德与社会课程教学中,逐渐开始加强以历史为背景的教学内容。图片史料资源能激发学生去探索的激情,并缩短学生与生活之间的距离,认识到品德
臂丛神经根性撕脱伤是臂丛神经损伤中的最严重类型,又称节前损伤,指构成臂丛神经的C5-T1神经根从各自在脊髓上的起点(丝状结构)处的断裂。其损伤的范围涉及神经根及部分神经
孔的无屑挤压加工是一种利用金属球形压刀、滚压工具等将另件已加工的孔进行辗平的一种新加工方法。由于在辗平过程中没有产生切屑,只是另件表面发生了塑性变形,因此一般称
运用文献资料法、问卷调查法、访谈法和数理统计法等研究方法,对渝西地区社区居民武术健身现状进行调查与分析。主要内容:渝西地区居民武术健身者性别年龄、职业特征和目的动
目的分析脑卒中患者吞咽障碍评估和营养支持护理体会。方法选择2018年1月到2019年1月在我院治疗的80例脑卒中吞咽障碍患者。将其按照营养支持护理方法的不同随机分为观察组40
介绍了在装车过程中进行油气回收的必要性,重点对四种常用的油气回收技术:吸收法、吸附法、冷凝法、膜分离法,分别从各个技术的性质、工艺特点、能耗等几个方面进行了分析与讨论
随着工业化和城市化的快速发展,城乡建设用地规模不断扩大。但是,我国大多数城镇都以“摊大饼”的模式向外无序发展,城镇的这种扩展模式,占用了大量的农业用地尤其是耕地,使