基于情感词典的美妆领域在线评论文本情感分类研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:CBN_cntjlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络购物的出现和普及,人们已养成了线上购物以及在线发表商品评论的习惯,各个电商平台上都累积了大量的用户评论文本,针对这些文本进行自动情感分类对平台的各方使用者都有重要意义。本文以基于规则的情感分类方法展开,以电商平台中美妆领域在线评论文本为研究对象,研究目的在于对现有的情感词典进行改进和扩充,构建出更加适用于美妆领域在线评论文本的情感词典,并制定配套的情感计算规则,提升该领域在线评论文本的情感分类效果。本文主要从以下三个方面开展研究工作:第一,将已有的两部通用情感词典HowNet情感词典和中文情感词汇本体库分别应用于美妆领域在线评论文本的情感分类,考察其分类效果。实验发现已有的两部情感词典在美妆领域在线评论文本的分类中效果均不理想,表现出较低的准确率、召回率和F1值。接着对实验中产生分类错误的文本进行分析和总结,共总结出4类导致分类错误的原因,据此归纳出已有情感词典在美妆领域在线评论文本的情感分类中需要改进的三个方向。第二,按照归纳出的方向对已有情感词典进行有针对性的改进和扩充,通过对大规模真实文本的统计和语义分析完成情感词典的构建,最终构建出由基础情感词典、新增情感词典以及辅助词典三部分共7个子词典构成的美妆领域在线评论文本情感词典,并制定出针对词项和文本两个层面的配套情感计算规则,实现完整的情感自动分类系统的建立。第三,将本文所构建的美妆领域在线评论文本情感词典应用于实际评论文本的情感分类。将基于本文所构建词典的分类实验结果与基于两部已有通用词典的分类实验结果进行对比,分析评价指标的变化情况,以此来考察本文所构建词典的分类有效性。并对实验中产生分类错误的文本进行分析,总结目前的分类方法中仍存在的不足之处,以期今后能有进一步的发展完善。实验结果显示,基于本文所构建的美妆领域在线评论文本情感词典的分类方法在针对该领域正、负向情感文本进行分类计算时,准确率分别达到97.75%和91.03%,召回率分别达到94.19%和86.27%,F1值分别达到95.94%和88.59%,与基于已有情感词典的实验结果相比提升显著,实现了较好的情感分类效果。
其他文献
《诗经》是我国诗歌发展的重要源头,其中包含着大量的物候知识,在那个农耕文明的时代,动植物、气象水文的变化发展对先民们的生产生活有着重要的影响,春秋代序,时令往来也对人们的情绪和心理产生着潜移默化的影响。动植物、气象水文的变化发展在诗篇中也有大量的体现,大量物候的出现并不是偶然的。《诗经》中的物候现象与“托物起兴”有着精紧密的联系,与全诗内容是契合且情景交融的,与诗篇的思想内容也是紧密相连的。《诗经
学位
节日是人们主动创造、建构的综合性的民俗活动,是一个民族文化的主要承载体。一个民族深层的文化内涵常常外显为节日中种种的习俗实践,从节日的研究中能够进一步了解一个民族人民的深层情感与信仰。七月半不是普米族的原生节日,但现在已成为普米族的传统节日。七月半是普米族在定居兰坪之后主动建构的节日,以此来赋予自身在新的环境下以重要的意义。本文运用文化表征理论,研究普米族七月半中的文化内涵。通过文化表征理论的运用
学位
快速推进的城镇化进程促进了土地利用结构的变化。建设用地迅速扩张,向农村田地延伸和蔓延,导致耕地数量减少并危及区域产粮安全。农村居民点用地是城乡建设用地重要组成部分,其面积占城乡建设用地总面积的15%左右,其空间分布直接导致农村土地利用系统的结构性变化。在乡村振兴实施背景下,我国的农村土地空间格局正发生着深刻转型,研究农村居民点用地变化结构、过程和机理,对化解人地矛盾、优化国土空间、保障新型城镇化发
学位
“X+如+人称代词”格式在网络交际中被广泛运用。本文以“X+如+人称代词”格式为研究对象,结合事实语料,从构成成分、句法语义特征、语用功能和历时考察五个方面对该格式进行探讨与研究。全文共分为五章,具体研究内容如下:第一章为绪论。首先明确本文研究对象——“X+如+人称代词”格式;然后介绍与格式“X+如+人称代词”相关的研究成果。阐明“X+如+人称代词”格式的研究意义;最后对研究方法和研究语料来源进行
学位
本文在“构式语法”的理论框架下,对评价构式“不是所有(的)X都叫Y”进行了考察,分析了构式的构件成分、构式义、构式义的浮现机制以及构式的功能。本文共由5个章节组成:第一章为绪论部分,明确了本文的研究对象为新型评价构式“不是所有(的)X都叫Y”,对“构式语法”和“评价构式”的研究现状进行梳理,总结了“不是所有(的)X都叫Y”的相关研究成果。在此基础上,介绍本文的研究方法和语料来源。第二章在构式认定的
学位
“不是X胜似X”是汉语中长期存在的一个语言结构,用以表达对某一对象的主观评价。文献考察发现前人对该结构的研究并不充分,我们拟在前人研究的基础上,以认知构式语法为理论基础,对“不是X胜似X”进行细致研究。论文的结构安排如下:第一章为绪论。绪论部分简要介绍了本文的研究对象和研究意义,分析了国内外构式理论研究的现状以及汉语学界对评价构式的相关研究,最后简述本文的研究方法和语料来源。第二章为构式鉴定和构件
学位
随着我国经济的不断发展,对外交流的增多,越来越多的外国人开始学习汉语,汉语国际教育越来越热门,作为其中重要的教学形式,词汇教学成为其中的重要组成部分,借助中国经典文学作品进行人物形象词汇教学不仅有利于中国传统文化的对外传播,而且有利于帮助学习者了解中国人的民族气质,思想价值观以及文化内涵。孙悟空作为我国经典神魔小说代表人物,不仅深受国内读者的喜爱,在汉语国际教学中也深受外国人的喜爱,而且它身上还浓
学位
2020年爆发的新冠疫情,造成了人类历史上的一次重大灾难,对人类自身以及社会的发展带来极大危害。为了防止疫情的扩散,中国第一时间采取了坚决有力的应对措施。在疫情逐渐取得成效的同时,中国不忘为世界各国抗击新冠疫情提供帮助,这些都对中国形象造成了不容忽视的重大影响。留学生作为人际传播国家形象的重要群体,是国家之间交流沟通的重要媒介,在一定程度上可以反映出国际社会对中国此次抗疫的态度,从而体现中国形象。
学位
自本世纪初以来,风电运营维护行业随着发展机遇与挑战在不断地由粗放型向精益型,间断型向持续型转型。风电机组装机容量高速增长,系统不断地改良与翻新,使其表现出来的故障规律日趋复杂,这对风电机组的可靠性分析以及预防性维护策略提出了更高的要求。因此,本文在研究国内外风电机组的可靠性分析以及维修策略现状的基础上,主要对风电机组进行基于随机故障率的风电机组可靠性分析、重要部件储备以及维修策略优化进行研究。本文
学位
互联网背景下,信息流通便利快捷的同时也给了谣言滋生的土壤,面对谣言泛滥的局面,如何提高网络辟谣能力成为重中之重的话题。正因如此,本文观察到前人对网络辟谣语篇研究的不足,在系统功能语言学指导下对微博辟谣语篇进行分析,以期了解网络辟谣语篇的语言学特征并指导相关语篇写作。论文共分为五章:第一章为绪论。绪论部分首先对本文的研究对象微博辟谣语篇作出界定,并简要描述其不同于传统语篇的特征。随后交代了语料来源、
学位