基于KNN模型的藏文文本分类研究与实现

来源 :高原科学研究 | 被引量 : 0次 | 上传用户:cocoxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文本分类技术的日益成熟,越来越多的分类模型已经被引用到藏文文本分类的研究和实验中,其中KNN分类模型由于其简单易操作等特点被广泛应用。文章以新闻类文本为语料,通过KNN模型对藏文文本进行分类研究与实验。首先,构建文本词特征向量并对其进行相关降维处理;然后,利用欧式距离算法获取预测样本与训练样本之间的相似度;最后,根据K最近邻投票原理,预测样本类别。实验表明KNN模型对藏文文本的分类性能较好。
其他文献
在高中语文作文教学中,我们常常感叹学生们的作文千人一面,少有新意。究其根源,思维的沿袭和雷同是主因。为此,教师在作文教学中激发学生们思维的独特性就分外的必要了。那么,怎样
呃逆是一种常见的临床症状,顽固性呃逆严重影响正常生活,给患者带来痛苦,按照引发顽固性呃逆的病因,有针对性选择药物治疗,能有效控制和治愈顽固性呃逆。现将顽固性呃逆的临
导语:$$ 国务院看准电商的顾客特点,特意选在“五四”青年节之际签署《关于大力发展电子商务加快培育经济新动力的意见》,部署进一步促进电子商务创新发展,降低电子商务准入门
报纸
<正>近日,国家食品药品监管总局发布今年第3期药品、医疗器械、保健食品违法广告情况。其中,十个情节严重的违法广告主要违法情况如下:(1)成都天银制药有限公司生产的药品"雪
<正> 初三化学“溶解度”一节是“溶液”整章内容的教学重点之一,也是难点之一。我们根据教材的具体内容,认为主要采用启发式教学有利于突出重点,解决难点;有利于学生“双基
<正>近日,辽宁抚顺市人民政府召开新闻发布会,向社会发布:抚顺琥珀获得国家地理标志产品保护。琥珀是远古树脂经地质作用掩埋地下,经过数千万年以上的系列地质运动形成的有机
氨基糖苷类抗生素在治疗感染性疾病中起着重要作用,尤其是革兰阴性菌引起的严重感染,但是随着临床上耐药菌株的出现较大地限制了此类抗生素的应用,因此,在对细菌耐药机制研究
<正> 为了提高思想品德课教师的教学水平,进一步加强思想品德课教学管理,使广大教师认明前进目标,逐步沿着科学化轨道改革教学,我们在1985年、1988年两次评选优秀课的基础上,
<正> 长期以来,在中学数学教学中,人们重视基础知识和基本技能的传授与训练,而忽视了美育的渗透。不善于发掘数学本身所特有的美,不注意用数学美来感染诱发学生的求知欲望,激