面向用户评论文本的细粒度情感分析研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:coralcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度情感分析是自然语言处理领域的一个重要任务,在商品评论分析、舆情分析、心理健康监测等方面有着广泛应用。但细粒度情感分析研究仍然面临同一方面词存在不同的情感极性、多个方面词与多个观点词相互配对,以及包含隐式方面词和观点词的情感四元组抽取等挑战。针对上述挑战,本文从以下方面展开研究:(1)针对同一方面词存在不同情感极性的问题,提出了一种基于文本片段搜索的方面情感三元组抽取模型。该模型首先通过BERT模型来学习句子中每个单词的向量表达,接着基于单词表达来搜索所有可能的文本片段,最后再将候选文本片段分别送入方面词观点词预测层和情感极性预测层,得到情感三元组。实验结果表明,该模型可以通过对文本片段对极性的预测来解决同一方面词具有不同情感极性的问题。(2)针对多个方面词与多个观点词配对问题,提出了一种基于依存图卷积的方面情感三元组抽取模型。该模型基于词之间的依存关系构建图网络,然后通过图卷积神经网络来学习词之间的依存句法知识,进而建立远距离的方面词与观点词之间的联系,同时还可以基于依存句法标签来判定观点词所表达的情感极性。实验结果表明,依存图卷积的融入可以帮助模型发现远距离的方面词与观点词之间的联系,进而提升模型的抽取效果。(3)针对包含隐式方面词和观点词的情感四元组抽取问题,提出了一种基于领域适应预训练的隐式情感四元组抽取模型。该模型在方面情感三元组抽取模型的基础之上,通过引入两个特殊符号[IA]和[IO]来学习隐式的方面词和观点词。此外,为提升模型对评论文本的语义理解能力,提出了适合细粒度情感分析任务的遮蔽方面词观点词预测任务。实验结果表明,该模型可以有效抽取隐式情感四元组。同时,在多个细粒度情感分析任务上的实验也证明了基于领域适应预训练的方法的有效性。综上所述,本文以细粒度情感分析为研究对象,围绕方面情感三元组和隐式情感四元组抽取任务,结合文本片段搜索、依存句法分析以及领域适应预训练,提出了三种细粒度情感分析模型,并在相关数据集上取得了较好的结果。本文的工作有利于细粒度情感分析的研究发展,并对基于用户评论文本的商品分析、舆情分析具有重要意义。
其他文献
Geohash编码作为一种降维技术已应用于众多空间数据库和空间数据引擎中,但关于其安全性的研究还较少。本文关注Geohash编码存在的安全漏洞,从理论上分析了此种降维技术产生推理通道的原因,并设计了两种基于k近邻查询的加密Geohash索引重构算法和一种基于区域查询的加密Geohash索引重构算法,通过观察大量查询响应进行统计推断并重构出加密Geohash的原始值,具体工作如下:1)研究基于k近邻
学位
以往道路改造大多采用路面结构挖除重建、加铺等手段,易造成环境的污染及资金、资源的浪费。道路养护维修设计作为项目实施的依据,应积极推广应用四新技术,降低施工成本,缩短施工工期,提高项目质量,减少施工废弃料对环境的污染,提高项目的科技含量,响应国家“建设节约型社会、可持续性发展”的号召。
期刊
当前的区块链交易本身存在高延迟、高手续费等问题,这些问题与实际支付场景直接冲突。针对以上问题的现有研究包括状态通道、支付中心等方案,将链上支付转移至链下从而缩短支付时延。但是一方面,现有研究未充分考虑现实支付场景,不能有效降低交易手续费。另一方面,现有研究引入了大量的额外资金,提高了使用者的资金门槛。因此,本文提出了一种基于商户联盟的区块链快速交易架构方案。本文设计了两种适用于支付场景的数据存储结
学位
随着语音助手、问答社区、智能客服等应用的兴起,人们更愿意使用方便快捷的互联网检索自己感兴趣的内容。然而,对于同一种问题,每个人的表述方式却不尽相同。如何正确理解用户意图,从数以百万计的问题库中返回最相似的问题是工业界以及学术界研究的重点。传统的问句匹配模型基于人工构造特征计算文本之间的相似度。然而,人工构造的特征只考虑了文本的浅层次信息,也不具备可迁移能力。现有的深度学习匹配模型虽然能够挖掘文本的
学位
近年来城市河道面临雨天反复污染问题,泵站雨天溢流是影响城市河流水质稳定达标的重要原因。结合河道护坡地形,将潜流人工湿地构造为护坡湿地,研究不同运行工况和进出水构造条件下湿地对污染物的去除效果并分析去除机理。结果表明,护坡湿地在垂直流工况下,进水管水平长度为3.6 m(占污水处理区水平长度的90%),出水管高度为0.65 m(占污水处理区高度的81.25%)为最优进出水构造,在该进出水构造下湿地对C
期刊
背景:肝脏是人体内的重要器官,具有合成蛋白、新陈代谢、药物解毒等功能。肝脏疾病的高发病率在全球范围内造成了严重的公共卫生问题,因此迫切需要建立高度仿生的人体肝脏模型,用于肝脏生理、病理机制研究和治疗方法的开发。药源性肝损伤是常见的肝损伤原因之一,对乙酰氨基酚作为孕期常用的镇痛药,其代谢产物会穿过胎盘对胎儿肝细胞造成损伤。由于伦理和安全考虑,临床试验很少研究药物在妊娠期对胎儿的影响。构建与人类胎儿相
学位
小学体育课程的学习可以使学生提高运动意识,促进学生身体素质的提升。随着新课改的推进,在体育教学中只有教师改变教学的观念,根据学生的身体特点和兴趣,创新教学的方式,为学生打造出有助于身心健康发展的课程,促进体育教学的改革和发展。基于此,对"双减"背景下小学体育高效课堂教学进行研究,以供参考。
会议
数据在现代化应急指挥、防灾减灾过程中发挥着至关重要的作用。结合突发事件应急管理中受灾人口核查对相关数据即时性、高效性等客观需求,论述了手机信令数据的时空大数据特性,并阐述了针对原始信令数据的预处理、综合聚类等基本处理手段,辅助管理部门进行灾情预警、监测和评估,并间接估算灾区受灾人口,对进一步提升我国重大灾害的应急处置能力具有借鉴意义。
期刊
位置服务是当代生活必不可少的一个环节。当前,GPS、GLONASS、Galileo以及我国的北斗等全球卫星导航系统,在室外定位的场景下,可以提供较高精度的定位服务,但是在室内环境下,相应定位技术依然不够成熟,因此室内定位技术近些年来受到持续的关注。其中,指纹定位方法以其方便、低成本等特性成为室内定位研究的热点之一,该方法的定位效果依赖于构建的指纹库要实时地反映定位信号环境的变化,这就需要对室内定位
学位
海洋模式是地球系统模式的具有代表性的一种,用于研究海洋环境演变的机理。目前海洋模式的研究愈发复杂,海洋模式方程的数据复杂度不断攀升,如何处理大规模的海洋模式算子任务成为关键问题。海洋模式算子任务可拆分性强,具有良好的并行性,适合在异构集群上使用多级并行计算来加快计算速度。本文面向海洋模式算子这一任务类型,利用算子任务的特性,提出异构集群上的负载均衡策略,主要分为以下三个方面:(1)研究海洋模式算子
学位