基于语义串抽取及主题相似度度量的维吾尔文文本分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:syhappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法.实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能.
其他文献
期刊
在实际应用中,基于振动信息的损伤识别法通常采用传感器来测量动态信号,并通过某种数学处理手段构造损伤指标来发现损伤、定位损伤和估计损伤量.该测量方法虽然灵敏度和精确
在中国制造的照相机中,有不少用名山、地区、方位名词作品牌的,如:华山牌、紫金山牌、峨嵋牌、嵩山牌、清凉峰牌、华蓥牌、华中牌、华夏牌、华西牌、东方牌等等。在中国制造
期刊
该文介绍了哈萨克文专用字母()、()、()的特殊书写习惯,以及哈萨克文编码字符处理现状.指出当前广泛使用的字母替换法不符合国际和国家相关标准,并且会导致哈萨克文排序错误,
本文首先分析了农村党建工作存在的问题,接着从完善农村党建工作的开展制度,注重农村文化建设工作的开展,注重“两学一做”工作的开展,抓好党建工作队伍建设等方面提出了加强
明明知道别人在偷你的东西,你自己却因为取证问题而束手无策 这种无奈可能将在未来一段时间里成为中国软件厂商的一种共有心态,而这种心态的起始时间,可能就是2002年7月15日
一、社保基金会概况(一)社保基金会简介1.法定中文名称:全国社会保障基金理事会(简称:社保基金会)法定英文名称:National Council for Social Security Fund,PRC(缩写:SSF)2.
“先学后教”是相对于传统教学中的“先教后学”而言的,它以发挥学生的主体性为主,让学生在自由环境中主动地去求知、求学,这对调动学生的学习积极性,提高学生的学习效率起着
近日,俄罗斯电视新闻节目播放了由计算机生成的白杨-М公路机动洲际弹道导弹(ICBM)释放弹头与气球诱饵的影像资料。导弹头锥与其第二级分离,随后释放了一个弹头和8~10个诱饵
踱入一家专营摄影书刊的小铺,各类图书琳琅满目,我立刻被肖全的摄影图册《我们这一代》所吸引。肖全先生追随法国摄影家马克·吕布多年,将这位纪实摄影大师探索人性、反映时
期刊