一种基于向量夹角的k近邻多标记文本分类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:lpp110894
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标记学习中,一个示例可以有多个概念标记。学习系统的目标是通过对由多标记样本组成的训练集进行学习,以尽可能正确地预测未知样本所对应的概念标记集。k近邻算法已被应用到多标记学习中,该算法将测试示例转化为多维向量,根据其k个近邻样本的标记向量来确定该测试示例的标记向量。传统的k近邻算法是基于向量的空间距离来选取近邻,而在自然语言处理中,文本间的相似度常用文本向量的夹角来表示,所以本文将文本向量间的夹角关系作为选取k近邻的标准并结合k近邻算法提出了一种多标记文本学习算法。实验表明,该算法在文档分类的准确率上体现出较好的性能。
其他文献
目的:分析超低及极低出生体重儿母亲孕期危险因素,观察其出生后并发症、治疗效果及预后。方法:回顾性分析2015年10月—2017年10月收治的超低出生体重儿(ELBWI)及极低出生体重儿(VL
文化移情能力是外语学习的必要因素。本文回顾了跨文化移情在外语教学中的相关研究,分析了英语听力理解的三个阶段,并基于跨文化交际研究探讨了移情在促进学生听力理解中的作
目的:通过比较(endoscopic thyroidectomy via the areola,ETCAA)和(open thyroidectomy,OT)两组患者术后6个月以上的患者对美容满意度疤痕、自我意识评分及观察员对Vancouve
随着经济的发展和社会建设水平的提升,建筑施工的很多细节内容得到了较高的关注。从目前所掌握的情况来看,建筑施工原材料质量检验工作,已经成为了重点内容,且引起了社会上较
粮食安全主旨化原则系由粮食是关系国计民生的特殊商品和重要战略物资所决定。粮食政策法律化原则系市场经济的发展、依法治国基本方略实施的必然结果。央地立法协调化原则是
本文以2012—2017年的江苏高考历史选择题为例,论述运用选择题培养高中学生的"历史理解"核心素养,从"历史理解"的五个方面的内涵进行分析,提出要选择能够比较全面地考查和体
良好的习惯是学生进步的阶梯,这是因为学生如果养成不良的习惯就很难进行纠正。幼儿在早期所获取的经验,会在孩子的一生中留下非常深刻的印象。因此对于幼儿良好习惯的培养是
"刘易斯—拉尼斯—费景汉"模型是发展经济学用于解释发展中国家劳动力流动及经济社会均衡发展的重要理论。基于该模型三阶段劳动力供求关系的变化,不难发现,政府对推进农业转
初中学生的身心发育大多处于青春期阶段,全面提高初中生的素质,青春期教育是重要的方面.本文就笔者在初一、初二学生中开展青春期教育活动做肤浅小结.
目的:探讨动态评估降钙素原(PCT)、超敏C-反应蛋白(hs-CRP)及前白蛋白(PA)在慢性阻塞性肺疾病(COPD)患者的临床意义,为临床诊疗提供参考。方法:将2014年8月—2015年12月收住