论文部分内容阅读
由于传统K-近邻分类方法需要计算每个待测样本与所有训练样本的距离,学习效率较低。针对这个问题,提出一种改进的快速K-近邻分类方法 SK-NN。该方法首先对训练样本采用K-均值方法进行聚类,并得到聚类结果中每个子集的中心和半径,并根据其选择合适的子类并采用该子类对待测样本打标签。由于聚类后得到的子类的规模远小于原始样本的规模,因此需要计算的距离数目减少,提高模型的效率。