论文部分内容阅读
KNN算法在决定测试样本的分类时,如果样本数量太大,那么在搜索测试样本的K个最邻近时的算法计算量很大。针对KNN的不足提出了一种改进方法,在对数据进行预处理的基础上,实现了K最近邻居分类算法。结合发电企业行业及专业数据信息检索的特点,通过KNN算法,对终端用户输入的检索关键字集合进行了预处理,生成了新的检索关键字集合。