基于短语的维吾尔文文本分类

来源 :计算机应用 | 被引量 : 11次 | 上传用户:Maggie0932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征表示是在文本自动分类中最重要的一个环节。在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机(SVM)算法对维吾尔文文本进行了分类实验。实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔文文本分类的准确率和召回率。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
采用半色调技术与三基色原理,将半色调的彩色秘密图像的每个像素加密扩展为只有红、绿、蓝、黑四种像素组成的方块.每个方块中各个像素的比例值相同,但排列方式不同,依照此特
近些年,中国的“非市场经济地位”问题在学界被探讨得越来越多,中国《入世议定书》第15条(d)规定的终止条款是这一问题的源头。中国出口商频繁地被WTO其他成员国提起反倾销调查
最近几年,中国逐步进入了房地产事业飞速发展的时代。越来越高的房价,使得普通公民购买商品房成为一项沉重的负担。这种情况下,小产权房便应运而生了。但是小产权房的存在却备受
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在庞大的公司法体系中,有一些制度是专为公司股东、特别是少数派股东的权利救济设计的,异议股东评估权制度就是其中之一。该制度于1858年诞生于美国,经过一百多年的发展,时至今日
我们需要共同体,我们需要认同。关于人类社会的解读,可以从共同体的视角出发。在中国社区建设过程中,我们的讨论多基于以居民委员会、街道管理委员会等层面推进社区建设,组织社区
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
我国在推进依法治国,建设社会主义法治国家进程中,劳动者发挥着无可替代的作用,劳动者权益的维护对法治国家建设具有重要意义。随着社会经济的发展,人们从以前重视物质性生活
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥