一种截断距离和聚类中心自适应的聚类算法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zhangwahaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】研究一种新的聚类算法,以改进密度峰值聚类算法无法自动计算截断距离以及需要人工参与选择聚类中心的不足。【方法】首先提出一种基于信息熵的截断距离自适应算法,实现了DPC算法截断距离的自适应;然后根据排序图中权值的斜率变化趋势确定拐点,自动划分出聚类中心与非聚类中心的界限,实现聚类中心的自动选择。【结果】通过在UCI数据集与人工数据集上的仿真实验,对DBSCAN算法、DPC算法、DGCCD算法、ACP算法与ADPC算法进行聚类性能的比较,结果表明ADPC算法不仅能够自动选择截断距离与聚类中心,在准确率、标准互信息(NMI)、F-measure值等性能上也有较大的提升,同时证明了改进算法在处理移动终端定位数据上的有效性。【局限】主要针对低维度数据集,面对高维度数据集略显乏力,同时未能兼顾处理大数据集时的效率问题。【结论】ADPC算法能够准确选择聚类中心和截断距离,对于低维度、任意形状簇的处理效果良好。
其他文献
鸦片战争以后,中国社会进入了大变革时代,传统的封建教育满足不了社会所需要的人才,于是中国的教育走上了近代化之路,其中一个重要内容就是新式学堂的创办。江西由于受经济文
校园危机事件发生后,学校有必要承担起心理危机干预的责任,尽量减轻危机给师生带来的身心问题,恢复其正常的功能水平。本文阐述了一位高中生在校内突发死亡后学校的危机干预
在孩子遇到事情犹豫不决的时候,列表来做选择不失为一个好办法。这样可以使他逐渐学会梳理事情的细枝末节,仔细分析情况的是非曲直,从而做出比较明智的选择。 When children
期刊
【正】 一、正确认识期刊产业的今天和未来 国际上期刊早已走上了产业化、集团化的道路,而且期刊产值正越来越大于图书产值。据我们所知的数据:1994年,美国期刊产值是图书产
大型超市商品种类数量众多,管理中存在过程繁琐,易出错,易丢失和购物时效低等问题。结合RFID和ZigBee等物联网技术对智慧超市系统设计,实现商品快速结账,商品防盗,智能推荐功
近些年,我国各个地区都在积极贯彻落实“一带一路”战略。“一带一路”战略也为我国企业提供共享的外交发展载体,促进区域经济走向世界。众多的茶企在国家政策的引导下步步成
经常接触相片扫描的朋友应该都会遇到过这样的问题:保存条件有限的照片总是有程度不同的折痕或污渍,扫描之后,折痕和污渍在图像上挥之不去极为刺眼,严重的还会使图像报废。虽然用
设计了一种新型交叉耦合结构带通滤波器,采用了凹槽环形式谐振器,使得获得同样的耦合系数新型结构相邻两环间的距离明显减小,因此这种滤波器具有小型化的优点。通过在传输函
语言学习并不是孤立的,而是产生与一定的环境之中。课堂师生言语互动可谓是无处不在。课堂教师提问——教师提问,学生回答,这一在英语课堂中出现频率最高的互动方式,对于教学
目的:观察家庭化护理模式引入产科产妇护理实践的应用效果。方法:选择产妇130例为研究对象,随机分为观察组和对照组,每组各75例。对照组产妇施以常规产科护理模式,观察组产妇