基于k近邻的多标签分类算法性能比较

来源 :太原学院学报(自然科学版) | 被引量 : 0次 | 上传用户:sun54965436
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为拓展k近邻法在多标签分类中的应用范围,分析不同测试方法在多标签分类中的性能.通过留一法对数据样本(Yeast,Image和Scene 3组数据集)进行预处理,采用欧式距离、余弦距离以及曼哈顿距离分别计算每个样本的k个近邻,分成训练样本1500个,测试样本917个;然后,根据近邻标签信息对每一类标签进行投票,形成新数据集;分别使用5种方法:k/2法、离散Bayes法、Logistic回归法、线性阈值函数法以及多输出线性回归法对数据集进行测试和性能评价.结果表明,5种处理方法在多标签分类中都拥有较好的性能,其中离散Bayes、多输出线性回归和Logistic回归性能相对比较优越.同时,不同的距离对算法的性能也有一定的影响.
其他文献
文章通过对中国学术期刊网络出版总库中2016—2020年有关5G技术下图书馆研究的文献进行检索和梳理,总结分析了近五年国内基于5G技术的图书馆的发展现状,在文献述评基础上提出存在的问题和建议,以期掌握目前的研究状况,并揭示智慧图书馆未来的发展方向.研究发现,我国目前针对5G时代的图书馆研究和建设虽然发展迅速,并取得了一定成果,但仍处于探索及初步发展阶段,理论体系尚不成熟,研究领域有待进一步拓宽.