基于短语的维吾尔文文本分类

来源 :计算机应用 | 被引量 : 11次 | 上传用户：Maggie0932

【摘要】

：

文本特征表示是在文本自动分类中最重要的一个环节。在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机(SVM)算法对维吾尔文文本进行了分类实验。实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔

【作者】

：

阿力木江·艾沙吐尔根·依布拉音库尔班·吾布力李哲

【机构】

：

新疆大学现代教育技术中心,乌鲁木齐830046新疆大学信息科学与工程学院,乌鲁木齐830046;新疆大学信息科学与工程学院,乌鲁木齐,830046;新疆大学现代教育技术中心,乌鲁木齐,830046;

【出处】

：

计算机应用

【发表日期】

：

2012年10期

【关键词】

：

文本分类短语抽取支持向量机维吾尔语互信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

华南农业大学珠江学院教师作品选

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

华南农业大学珠江院教师

基于排列的(2,n)门限彩色视觉密码方案

采用半色调技术与三基色原理,将半色调的彩色秘密图像的每个像素加密扩展为只有红、绿、蓝、黑四种像素组成的方块.每个方块中各个像素的比例值相同,但排列方式不同,依照此特

期刊

半色调三基色原理视觉密码

“中国非市场经济地位”问题研究

近些年，中国的“非市场经济地位”问题在学界被探讨得越来越多，中国《入世议定书》第15条(d)规定的终止条款是这一问题的源头。中国出口商频繁地被WTO其他成员国提起反倾销调查

学位

非市场经济地位世界贸易组织《入世议定书》外商投资法

小产权房问题研究——以土地管理法修改为视角

最近几年，中国逐步进入了房地产事业飞速发展的时代。越来越高的房价，使得普通公民购买商品房成为一项沉重的负担。这种情况下，小产权房便应运而生了。但是小产权房的存在却备受

学位

小产权房二元土地结构土地管理法市场经济

郭日情/俞冬日作品

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

异议股东评估权制度比较研究

在庞大的公司法体系中，有一些制度是专为公司股东、特别是少数派股东的权利救济设计的，异议股东评估权制度就是其中之一。该制度于1858年诞生于美国，经过一百多年的发展，时至今日

学位

异议股东评估权制度股东保护立法完善

城市社区认同机制研究——以苏州工业园区“新邻里主义”为个案

我们需要共同体，我们需要认同。关于人类社会的解读，可以从共同体的视角出发。在中国社区建设过程中，我们的讨论多基于以居民委员会、街道管理委员会等层面推进社区建设，组织社区

学位

城市居民社区认同日常生活合作共治原则

郭中超水粉画

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

劳动尊严权的法律制度保障研究

我国在推进依法治国,建设社会主义法治国家进程中,劳动者发挥着无可替代的作用,劳动者权益的维护对法治国家建设具有重要意义。随着社会经济的发展,人们从以前重视物质性生活

学位

劳动尊严权体面劳动法律保障制度建构

鸡大肠杆菌病中草药佐剂多价灭活苗的研制Ⅱ.疫苗免疫产生期、免疫持续期及保存期试验

期刊

鸡大肠杆菌蜂胶佐剂疫苗

基于短语的维吾尔文文本分类

与本文相关的学术论文