论文部分内容阅读
传统的k-means算法及改进的k-means++算法中,簇的初始中心点选择都是随机的,这导致聚类结果可能陷人局部最优,使得算法对一些实际问题无效。为了克服这个缺陷,提出一种基于半径的k-means+λ算法,在选择簇的初始中心点时,根据A参数计算各点间距离比例,并以某个特定的距离为半径作圆,在圆内根据距离比例选择一个初始化中心点。在相同的测试环境下,采用KDDCUP99数据集测试。测试结果表明,相比k-means算法和k-means++算法,本算法在错误率和运算时间上具有更高的性能。