论文部分内容阅读
聚类是研究数据相似性的一种方法,它被广泛应用于统计学、气象学、医学等诸多科学领域.本文从提升预测能力的角度出发研究了聚类算法,并提出了增强收缩K-means算法,它是基于James-Stein收缩估计和学习向量量化(LVQ)方法的一种新的聚类方法.这种新算法主要考虑了无监督聚类和监督分类的优点,在每次迭代中,首先使用K-means算法为每个数据点获取一个临时标签,对于这些有标签数据,利用LVQ算法来获取原型向量,然后将前一阶段获得的聚类中心通过James-Stein估计量向原型向量收缩,最后再将这些收缩后的中心用于新一轮的K-means迭代聚类.算法不断执行“K-means-to-LVQ-Shrinkage”的迭代过程直到达到停止条件为止.此外本文还进行了大量的模拟数据和实际数据分析,以评估这种新方法的性能,并获得了很好的结果.