维吾尔语褒贬情感词典构建研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:lq306330997
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是对网络文本信息进行倾向分类的过程,是目前自然语言处理、信息检索、人工智能等领域的热门研究内容。中央提出的“一带一路”建设正在促进新疆企业发展的同时,在网络技术中也有了显著的进步。在这种良好的条件下,维吾尔语作为新疆范围内使用人口较多的语言,在此领域中也得到了前所未有的发展。大量的维吾尔语网站建立的同时得到了少数民族人群的追捧。这类动态交流式平台的普及使维吾尔网络文本数量快速增加,对这些文本所描述的言语快速、准确的分类,对于政府、企业、个人来说有着实用性的作用。维吾尔语属于阿勒泰语系,是黏着语。维吾尔语在结构上与英文和中文大有区别,语法功能的实现是以形态变化为主,因此,计算机处理起来比较复杂及繁琐。但换个角度来看,每一种变化都会遵守一定的语法规则并存在某种语言的表达形式。对语言内部规律进行探究,将它作为计算机技术的依据会更有效的识别该语言并且提高识别的准确率。本文将英文和中文情感词典的构建方法作为基础,更为详细的针对性的提出了维吾尔语情感词汇的语法特征,建立了基于语法的维吾尔语情感词汇识别规则及词汇褒贬性判断规则。首先,本文简述了情感分析研究的背景及意义,其次对英文和中文情感分析研究现状及情感词典的构建方法进行了阐述,最后进一步明确的探讨维吾尔语情感词典的构建方法及过程。本次研究主要分为两大步骤:第一步,对维吾尔语情感词汇及上下文进行了详细的探究,分析及总结维吾尔语情感词汇的基本规律。这些规律参考了英、汉文情感词汇获取技术的同时,主要是对维吾尔语言本身的语法特征及用词习惯方面做了深入的探究。并创建了包含较详细的维吾尔语情感词汇特征的识别模型及维吾尔语情感词汇极性分析规则库。第二步,按照特征模型自动识别文本中的维吾尔语情感词汇并利用规则库来判断该词汇的褒贬性。此过程中利用TF-IDF算法及机器学习的方法来提高识别率和词汇极性判断的准确率。
其他文献
中国共产党第二十次全国代表大会报告指出,要不断提升人民群众的获得感、幸福感和安全感。幸福感,作为关系人民群众工作和生活的重要问题,一直受到党和国家的广泛关注。同时,对于高中时期正值生理与心理快速发展的时期,心理健康的发展也广泛受到关注与重视。近年来,心理幸福感的水平高低逐渐成为个体心理健康与身心和谐可持续发展的重要指标。而感恩品质作为一种内在积极的心理品质,对于提升心理幸福感起到促进作用。同时,自
学位
闲暇生活是非正规教育中的重要组成部分,儿童是自身闲暇生活中最重要的主体,如何改进和完善农村大班幼儿闲暇生活,需要成人聆听儿童的观点,实现成人视角与儿童视角的沟通与理解。本研究运用访谈法、作品分析法对L村A幼儿园中21名大班幼儿及15位大班幼儿家长展开研究,以期探寻儿童视角和成人视角下的农村大班幼儿闲暇生活。通过扎根的方法对幼儿及家长的回答进行分析,对比两个视角下观点的异同,为完善农村幼儿闲暇生活提
学位
良好的学习品质有助于幼儿的入学准备,并影响其同伴关系与社会能力的发展,对幼儿终身发展具有十分重要的意义。绘本具有生动有趣的图片和简单易懂的文字,符合幼儿的阅读特点,深受幼儿的喜爱。而在众多绘本当中,科学绘本可以激发幼儿的学习兴趣,可以促进幼儿对问题和现象的思考,是培养幼儿学习品质的良好载体。中国本土科学绘本根植于中国本土土壤,不仅包含着一些中国特有的科学概念,还具有独特的中式审美,贴近我国幼儿的生
学位
G.A.科恩(G.A.Cohen)是世界著名的政治哲学家,有着坚定的共产主义信仰,是分析的马克思主义主要创立者和代表人物,段忠桥教授评价他为“分析的马克思主义的旗手、社会主义平等主义的斗士”。科恩在国际马克思主义研究领域有着非常重要的影响力,为马克思主义的平等观辩护做出巨大贡献。科恩的平等思想主要是在对西方自由主义平等思想中批判而来,因此,本文从科恩对他人平等思想的批判和对自己平等思想的建构两方面
学位
《狼图腾》是姜戎以狼为叙述主题的半自传体小说,讲述了发生在内蒙古大草原上的游牧民族与狼的故事,反映了人与大自然的关系。《狼图腾》是一部与众不同的小说,里面有大篇幅的作者评述及主人公的心理活动描写。这部小说2004年在中国出版后,广受读者欢迎,2008年葛浩文将其译成英文,也广受西方读者欢迎。接受美学强调读者的地位,认为读者是文学存在方式不可或缺的环节。接受美学理论对翻译产生了巨大影响,使翻译研究的
学位
社交网络如今成为了人们生活中必不可少的交流工具。在社交网络中,每天都有大量的用户和资源等信息产生,面临着大量的社交网络资源信息,推荐算法顺其自然的成为用户高效获取有用信息资源的重要手段。一个好的推荐算法可以快速准确的为用户推荐各种有用信息资源,然而,当前许多传统的推荐算法为了提高推荐准确度而忽视了可能存在的一些诸如冷启动、数据稀疏、单一评价指标等问题。本文主要是针对上述问题而开展研究。对于冷启动和
学位
反应扩散方程在生物数学中有重要的应用。通常,对于反应扩散方程常值平衡解的稳定性,非常值平衡解的存在性、不存在性等研究都具有重要意义。特别是对了解Turing斑图的生成具有重要的应用价值。近年来,许多人对Sel’ kov-Schnakenberg模型进行了大量的研究。其研究结果表明:每个参数的变化范围对常值平衡解的稳定性、不稳定性以及非常值平衡解的存在性和不存在性的不同作用。本文研究了一个推广的Se
学位
听力作为语言输入的基础,是其它语言技能发展的前提。不管是在日常言语活动中还是在各项英语等级考试中,听力都扮演着重要的角色,它应该在英语学习中受到重视。高中生处于听力学习的重要阶段,良好的听力基础对其日后的学习至关重要。然而由于种种原因,现阶段高中生英语听力状况并不理想。在高中阶段听力的教与学并没有受到重视,高中生在英语听力学习中仍然存在很多问题。本研究聚焦高中生英语听力理解障碍,在图式理论与语言学
学位
教师话语是教师在教学过程中所采用的一种语言。在英语教学课堂中,话语不仅是教师传授知识、组织课堂教学和执行教学计划的工具,而且还是学生语言输入的一个重要渠道。在中国,英语是一门外语,除了教师在课堂提供的有效输入,学生在课外较难找到其他有效的输入途径。因此,教师话语在教学过程中发挥着至关重要的作用。对高中英语教师来说,娴熟地掌握课堂话语的技能和技巧是最重要的专业素养之一,高中新课改推行10年来,一线高
学位
作为一种语言课程,英语课堂交流显得尤为重要。课堂提问是实现课堂交流最主要的教学方式,所以在高中英语教学中扮演着非常重要的角色。课堂提问直接影响着教师与学生之间的课堂交流,影响着学生积极性和主动性的发挥以及课堂气氛。因此课堂提问是一个值得重视和研究的重要课题。然而,当前高中英语课堂提问还存在许多问题值得我们去思考和解决。本研究聚焦高中英语教师课堂提问的有效性,以输入理论和交互理论为主要理论依据,通过
学位