基于多层核心集的凝聚聚类算法

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:liwang0113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是无监督模式分类的一个重要组成部分,也成为现代数据分析中越来越重要的一个工具。初始条件、相似性准则和聚类准则的不同产生的聚类算法也不尽相同。因此,聚类算法是一个内容庞杂的大家族。至今,众研究学者也提出了多种多样的聚类算法。许多经典的聚类算法,如平均链接、K-means、K-medoids、Clara、Clarans等,都是利用单一的聚类中心进行聚类。为克服单一聚类中心只能描述凸状聚类的缺陷,CURE、DBSCAN等算法使用多个代表点(或稠密点)表述任意形状的聚类结构,但仍难以聚类重叠和噪声数据。为此,本文提出一种新的基于多层“聚类中心”(称为“核心集”)的凝聚聚类算法(MulCA)。该算法创新性地使用了“多层核心集”表述聚类结构,使得每一层数据集向其“核心集”凝聚,同时上层的“核心集”自动成为下层的数据集,随着每层核心集规模按α比例迅速减少,控制了凝聚过程的迭代次数。由于现代社会的快速发展,大规模数据已经成为需要处理数据的主要成员,为此,本文引入了基于随机采样计算ε-核心集(RBC)的技巧,将MulCA算法应用于大规模数据集。并做了实验证明了算法对大规模数据的有效性。在人工和实际数据集上大量的数值试验充分验证了MulCA算法的有效性,以及相比于其他算法的优越性。
其他文献
自担任中职学校班主任工作以来,使我深深感受到面临的学生和班级,既有别于普通高中,又不同于一般的中专,因而需要有针对性地改革班主任工作,以符合我校学生和班级的实际情况,
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
“周内效应”指股票市场在一周内某一个交易日的股票平均收益率显著地高于或低于本周内其他任何一个交易日的股票平均收益率,并且在统计上显著为正或显著为负.由于最早的关于
一项由美国科学家们发起的研究表明,到2015年为止,人类共生产了约83亿公吨的塑料制品,其中约有63亿吨转化为塑料垃圾。世界经济论坛曾预计,到2050年,海洋中的塑料垃圾将多于
本文由五部分组成,主要讨论了控制微分方程解的收敛性及稳定性,包括三个方面:集值控制微分方程解的广义拟线性方法,模糊控制微分方程解的广义拟线性方法及集值控制微分方程解
期刊
SP短信系统是用于完成和通讯网络运营商ISMG之间短消息的发送和接收功能,使手机用户能够通过发送短信来使用SP提供的服务。随着社会通信行业的发展,短信的应用领域越来越广,
小学科学这门学科是以培养学生的科学精神、科学素养为主旨的启蒙课,它是以学生的生活为基础,认识、发现、了解生活中存在的科n学现象以及科学道理,培养学生科学的意识、 思想以