论文部分内容阅读
不平衡数据集的特点是类样本数量差异比较大,K近邻(K-Nearest Neighbor,KNN)算法在对这种数据集分类时,容易出现多数类偏向,即容易将少数类识别为多数类。LLRKNN算法是为了降低多数类偏向的影响,对K近邻样本进行重构得出权值,算法分类决策由K近邻样本的权值决定。实验结果表明,LLRKNN算法对不平衡数据集的性能优于KNN算法,具有更好的稳定性。