论文部分内容阅读
样本距离机制的定义直接影响到KNN算法的准确性和效率。本文提出了一种采用类相关度优化距离的KNN改进算法。将样本特征参数的熵值与样本分布概率的乘积作为特征参数针对分类的相关度,并根据相关度值衡量特征参数对分类影响程度的强弱以计算样本间的距离,解决KNN近邻选择时大类别、高密度样本占优的情况。实验结果表明,提出的采用类相关度优化距离-KNN算法提高了分类性能。