基于舆情分析的维吾尔语情感动词搭配研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:liongliong484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
舆情分析是对社会公众和社会现状的真实反映。它是对全社会大众心理和舆论的集中体现。情感分析为舆情分析提供基础,而情感动词词典为情感分析奠定基础。为了促使分析更加贴近舆情的真实现状,情感分析成了近年来迅速兴起的一个研究课题。对于汉英语等语言的情感分析研究工作历经多年,研究成效卓著。但,维吾尔语的情感动词搭配研究还处于初步阶段,本文虽然没能研究的很全面,但是弥补了这方面存在的空缺。本文所研究的内容主要有:首先是介绍了近几年来的国外和国内汉语,藏语及哈萨克语等语言的情感分析研究现状,技术和分析方法以及对其研究进展进行了整理总结。主要介绍了维吾尔语情感分析的目前的研究进展,并且归纳为几种算法与方法而且对其技术发展进行整理总结。其次,为了构建情感动词词典本文利用了中文极性情感How Net,NTUSD,同时以大连理工大学编纂的《褒贬情感词词典》交互计算,对其筛选与翻译,系统里做出了在线翻译词典并链接到国家翻译局网站进行在线批量翻译并构建了维吾尔语情感动词词典。使用火车采集器爬虫软件,利用爬虫技术从天山网爬取新闻语料,对其进行整理,去噪去重和分句处理构建电子语料库。另外,本文从语法角度对维吾尔语情感动词语法进行详细的研究并归纳总结了情感动词的搭配特征。情感动词搭配特征有分别从以下八个方面进行分析:情感动词与程度副词,派生动词,否定词缀,复合动词,不及物动词,发源动词,及物动词,构词轻动词,程度副词,连词的搭配特征。研究发现其三种搭配规则,分别是与构型词缀,构词词缀和轻动词的搭配规则等。最后,从计算语言学角度,方法和技术设计并实现了情感动词搭配规则分析系统。在已建立的具有1607个维吾尔语情感动词词典和20万条句子语料库的基础上,通过模糊查询,从语料库中查找含有情感动词的句子,最终获得18000个不重复的含有情感动词的句子建立维吾尔语情感动词句子语料库。在以上的研究的基础上,通过统计的方法分别对三种搭配规则进行分析,通过系统测试其识别的准确率分别是,规则一是情感动词构型词缀是84.83%,规则二情感动与词构词词缀的搭配是13.86%,规则三是情感动词与构词轻动词的搭配是26.55%。由于维吾尔语情感动词研究处于初步阶段,也没有公开的词典和语料库,因此避免不了一些遗漏和错误,需要更进一步的完善。
其他文献
目的:利用实验室前期筛选出的最优合成工艺,制备一种与姜黄素(Curcumin,CUR)药理活性相当的姜黄素-维生素E衍生物(Curcumin-Vitamin E,CUR-VE),并利用其自组装特性,经纳米沉淀法设计制备高载药量的姜黄素-维生素E衍生物自组装纳米粒(self-assembly nanoparticles of Curcumin-Vitamin E derivative,CUR-VE-
目的:观察胸腰段椎体成形术后(percutaneous vertebroplasty,PVP)三种不同骨水泥弥散类型对骨质疏松性椎体压缩性骨折(osteoporotic vertebral compression fracture,OVCF)的临床疗效及早期术椎再塌陷的影响。方法:对2018年7月至2019年9月采用PVP治疗OVCF(T11-L2)90例病例进行比较研究,术后常规摄胸腰段正侧位D
近年,全球经济处于稳步复苏的状态,从金融危机的谷底逐渐走出,但近期国际环境复杂多变,愈发严峻,如贸易保护主义、种族主义、地缘政治等负面形势持续不断凸显,导致全球经济增长开始放缓。在日益复杂的国际政治经济环境下,我国经济增长面临的下行压力有所加大。作为关系到国家经济命脉的行业,银行业一直以来备受重视和关注,受国家宏观政策和监管政策影响较大。城市商业银行经过多年的发展,逐渐成为国内银行业体系的重要一派
自2016年起,我国经济发展进入“新常态”,经济增速由高速增长转为中高速稳步增长。在经济发展新形势的影响下,我国的宏观金融形势也发生了比较深刻的变化,社会经济转型升级和产业结构调整进一步加速推进,金融业之间的竞争日益激烈,金融机构面临着一系列新情况、新变化、新问题。商业银行作为经济中最为重要的金融机构之一,信贷风险管理是其经营管理中的重中之重,同时也是银行中较大的风险点。在经济新常态背景下,A城市
智能计算方法是一种模拟自然界和智能系统基本规律求解问题的方法,可以把复杂问题通过特定的模型简单化表示,被广泛应用于众多研究领域。本文使用智能计算方法建立集成学习模
随着现代电子信息技术的进步,以互联网为依托的电子商务企业,也在二十世纪以来飞速发展。淘宝,京东,天猫等购物平台也在改变着人们传统的交易方式。我国电子商务市场进入成熟发展期并不可避免地出现了一些垄断走向。电商巨头为争夺用户市场,获取垄断利润,利用其市场支配地位,打压竞争对手或是利用中小型卖家对其依赖性,提高服务收费,挤压中小型卖家收益。如格兰仕空调起诉天猫案;神舟电脑起诉京东商城等电商竞争案件,表明
近年来,伴着互联网技术不断发展,网络游戏行业在不断发展,市场规模也逐步扩大,在同时,由于网络游戏行业本身的性质,造成网络游戏企业出现越发复杂与多样的重大错报风险,但是在当下,审计行业的准则并没有细致总结描述这类公司重大错报风险,这样情况下,出现部分会计师事务所审计网络游戏企业的结果是审计失败,如此情况下研究该种企业的重大错报风险变得很有必要。选择属于互联网行业的网游企业作为本文的研究案例,严谨分析
学习是生物体大脑的重要功能。1981年由Kohonen教授提出的SOM神经网络模型,被广泛用于大脑自组织、自学习功能的模拟与研究。同时,它在数据降维、聚类、模式识别、数据挖掘和
本文主要采用了实证研究的方法,对在宁独立学院的辅导员进行了调查,探讨了独立学院辅导员职业能力的现状、问题以及提升的对策建议。基于心理学、教育学和管理学等理论基础,
《集韻》收字秉承“務從垓廣”的原則,匯集了大量豐富的並列字頭。經統計,《集韻》中共有9307個並列字頭,其中,兩字並列字頭有6680個,占七成有餘。然而,《集韻》中並非每個字都有文獻用例,並列字頭之間的字際關係不那麼明顯。兩字並列字頭之間的字際關係比較複雜,根據字頭之間形、音、義的關係,可將兩字並列字頭字際關係分為異體字關係、異文關係、通假字關係和古今字關係四類。若兩個字是異體字關係,那麼這兩個字