聚类精度相关论文
作为一个广泛分布的全球信息服务中心,万维网集中了海量的信息,其中大多数是以网页文本的形式存放的。这些文本信息种类繁杂,缺乏组织......
聚类是一种重要的数据挖掘技术,它可以在不了解数据背景的情况下完成数据的划分,使得同一个划分中的数据相似度尽可能大,不同划分......
随着数据的增长和数据处理系统的不断改进,我们对开发强大而有效的数据处理和数据挖掘算法提出了更多要求,聚类算法作为数据挖掘的......
随着大数据时代的到来,数据规模呈爆发式增长,对数据存储和挖掘技术提出了更高的需求。多来源的海量异构数据以数据中心的方式存储......
针对传统模糊C均值(FCM)聚类算法聚类数目难以确定,迭代速度慢,易陷入局部最优以及对聚类中心初始值的设置敏感等问题,提出一种融......
传统的K-means算法虽然具有很多优点,但聚类准则函数对簇密度不均的数据集分类效果较差.文中在加权标准差准则函数的基础之上,增加......
聚类融合是聚类分析领域的一个研究热点,它将针对同一问题产生的多个聚类成员(即聚类结果)融合成一个结果,以提高聚类算法的鲁棒性和......
针对标准的K—均值算法聚类时所面临的初始聚类中心点及聚类个数难以确定的缺点,提出了一种改进的K—均值算法,其核心思想是通过基......
通过研究传统FCM和改进FCM算法,针对现有算法中存在收敛速度不够、聚类精度不高等问题,提出一种基于FCM算法的融合特征值和优化划......
针对K-means算法处理大规模数据时算法迭代时间较长的问题,提出一种基于分层抽样的大数据快速聚类算法(A Large Data Fast Cluster......
随着数字传感器、高性能计算与通信、大容量数据存储等技术的飞速发展,现代社会每时每刻都在产生着大量数据。机器学习是分析原始数......
基于图论理论的NJW谱聚类算法的核心思想是将数据点映射到特征空间后再利用K-means算法进行聚类,从而得到原始数据的聚类结果。NJW......
针对大数据环境下K-means聚类算法聚类精度不足和收敛速度慢的问题,提出一种基于优化抽样聚类的K-means算法(OSCK)。首先,该算法从......
传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储......
传统的K-Modes算法采用0-1简单匹配方法计算对象与类中心(Modes)之间的距离,并将每个对象分配到离它最近的类中去。采用基于频率方法......
Michael K.Ng等人提出了新K-Modes聚类算法,它采用基于相对频率的启发式相异度度量方法,有效地提高了聚类精度,但不足的是在计算各......
为了快速准确地实现航空发动机转子故障的分类与识别,提出了双阶自适应小波聚类方法。双阶自适应小波聚类过程是:首先采用粗网格量......
在传统FCM算法基础上提出一种称为特征加权和优化划分的模糊C均值算法(WGIFP-FCM).该算法结合了优化划分法和特征权重思想,得到特征......