论文部分内容阅读
为拓展k近邻法在多标签分类中的应用范围,分析不同测试方法在多标签分类中的性能.通过留一法对数据样本(Yeast,Image和Scene 3组数据集)进行预处理,采用欧式距离、余弦距离以及曼哈顿距离分别计算每个样本的k个近邻,分成训练样本1500个,测试样本917个;然后,根据近邻标签信息对每一类标签进行投票,形成新数据集;分别使用5种方法:k/2法、离散Bayes法、Logistic回归法、线性阈值函数法以及多输出线性回归法对数据集进行测试和性能评价.结果表明,5种处理方法在多标签分类中都拥有较好的性能,其中离散Bayes、多输出线性回归和Logistic回归性能相对比较优越.同时,不同的距离对算法的性能也有一定的影响.