论文部分内容阅读
针对K-均值聚类算法随机生成初始聚类中心使得算法容易陷入局部最优的局限性,笔者在综合考虑数据集中数据对象之间的相似性和数据对象密度分布特性的基础上,提出了一种基于距离-期望密度参数K-均值初始聚类中心优化方法.该方法将k个相互距离最远并且能够代表样本对象分布的数据对象作为初始的聚类中心,从而使聚类结果更接近于全局最优解.在UCI数据集上对改进算法进行的仿真实验表明,该方法的聚类结果稳定性和准确率均得到了优化.