基于机器学习的维吾尔文文本分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:chunzhu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Nave Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。
其他文献
近年来,新药研发不仅推动了医药产业的发展,同时还提高了人们的生活水平。药物分析关系到药品质量及用药安全,因此在新药研发中起着举足轻重的作用。高效液相色谱由于具有高
文章分析了我国企业专利实施中存在的对知识产权的重视等程度不足、专利技术尚欠成熟、缺乏实施专利的能力和动力以及专利实施成功率不高问题,提出了提高企业专利实施的战略
在房地产行业发展进入新时代,对房地产企业成本的管理也愈发显得重要。房地产企业的投资项目金额巨大,这一特点也要求房地产企业充分重视成本的管理与控制。只有科学合理的成
利用差示扫描量热计和热重分析法测定并研究国产涤纶阻燃剂的阻燃性能.
一般情况下,咳嗽是一种重要的反射性保护机制,通过排出呼吸道内的痰液或异物,保护呼吸道的清洁和通畅,从而防止感染的形成;但是如果咳嗽激烈持续,不仅病人痛苦影响日常生活和
目的分析替加环素与异帕米星联合用药治疗多重耐药鲍曼不动杆菌肺炎的疗效。方法在本院ICU2015年11月至2017年5月收治的多重耐药鲍曼不动杆菌肺炎患者中选出158例,随机分成对
<正>《庐山的云雾》以优美明快的语言,比喻、联想等修辞手法,描绘了庐山云雾千姿百态、奇丽多变的景象,字里行间流露出作者对庐山、对祖国山河美景的深深赞叹和热爱之情。在
期刊
以沈康高速客专西街高架桥为例,从上、下部结构型式及桥梁整体布置几个方面介绍在市政道路之上修建高速公路高架桥的桥型方案研究。
《魁拔》和《功夫熊猫》作为同类题材的系列动画电影,都体现出了主创团队对异域文化的借鉴和重构。二者从故事背景、人物角色和文化元素上体现出外在形式的"形似",同时又在上
我国的房地产业由于起步晚、基础差,与城市的发展存在着诸多不协调之处。该如何采取措施,才能促使房地产业的发展与城市发展的良性互动,使房地产业这一基础性、先导性产业更好地