论文部分内容阅读
本文介绍了广泛应用的k-means算法。针对其选择初始聚类中心和易受孤立点的影响的缺点,给出了改进的算法。首先使用距离法移除孤立点,然后采用最大高密度距离法(MDHD)对初始聚类中心的选择进行改进。并进行了改进前后的对比实验。实验结果表明,改进后的算法比较稳定、准确。改进后的算法应用到计算机语言教学中,达到较好的分类效果。