基于深度学习的情感原因对抽取方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:datou19881020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是对包含主观情感的文本进行分析、处理、归纳和推理的过程。情感原因对抽取(Emotion-Cause Pair Extraction,ECPE)是近年来情感分析领域中出现的一项新研究任务,其目的是抽取一段文本中由情感子句和原因子句组成的情感原因对。通过ECPE任务得到的情感与原因信息可以更好地帮助理解用户行为、分析产品质量与优化服务,并为政府、企业等决策者提供更多有价值的参考数据。越来越多的研究者基于深度学习开展ECPE任务的相关研究,目前ECPE任务的一种主流解决方法是基于深度学习模型的两阶段管道方法,第一步抽取情感与原因子句,第二步再将情感与原因子句进行配对。然而这种管道模型存在以下不足:(1)分步抽取的方法不够自然,忽略了情感和原因作为一个整体的内在联系;(2)不同步骤之间可能会存在错误传递的情况,进而影响最终结果的表现。随着预训练模型在许多任务上取得优异成绩,研究者尝试引入预训练模型解决ECPE任务。他们将预训练模型作为子句编码器,为下游任务提供更好的向量表示。然而研究发现以BERT为代表的预训练模型不仅能提供动态的向量表示,而且具有捕捉句子之间逻辑关系的能力。针对以上问题,本文将从以下两个方面对ECPE任务的解决方法开展研究:(1)基于端到端的方法提出了带有范围控制器的层级神经网络模型(RHNSC),该模型通过端到端的方法直接抽取文本中的情感原因对,有效地避免管道模型中存在的不足,同时模型以多任务学习的方式更充分地挖掘子句中的情感原因信息。另外基于统计分析发现文本中情感原因对一般是相对距离较近的子句对,本文提出了范围控制器模块,它能有效地控制模型预测情感原因对时更关注较高可能性范围内的结果,进而提高预测的准确性。通过实验结果分析,RHNSC模型有效地解决了两阶段方法中错误传递的问题,在ECPE任务的表现上优于两阶段管道模型方法。(2)基于预训练模型BERT提出了一种新的解决ECPE任务的方法,将ECPE任务看作子句对之间的关系预测,利用BERT模型学习两个子句之间是否存在情感原因关系。另外,通过模仿BERT预训练过程中下一句预测任务的训练形式,在原始语料的基础上重新构建新的语料数据集,有效地扩充了训练数据的大小。与其他使用BERT的方法相比,本文提出的ECPE-BERT模型更加简单,不需要额外的配对模块设计,但在解决ECPE任务的效果上取得了更好的表现。
其他文献
计算美学是通过计算机方法构建人类审美感知的模型,量化现实物体的美感程度。随着人们对美的追求愈来愈强烈与计算美学在日常生活领域的潜在实际价值,计算美学逐渐成为研究者们的热门研究课题。研究计算美学有助于在教育领域与社会商业活动,指导学生绘画学习、帮助设计师判断海报元素美观程度、辅助摄影师对当前取景画面进行美学质量评价与裁剪等,为观看图像的人们提供更好的视觉享受。所以,研究计算美学与实现性能优异、可落地
学位
在线教育平台的快速发展给现代教育带来了更多的资源以及更好的个性化学习的体验,但是目前的平台还无法满足学习者日益增长的对个性化学习的需求,尤其是在知识追踪的领域,如何通过挖掘学习者的学习过程中产生的历史数据,对学习者知识状态进行分析,并对学习者未来的表现进行预测是一个非常值得关注的问题。本文以知识追踪任务为研究主题,结合图神经网络的概念把试题知识点网络引入到知识追踪模型中,探索结合学习者遗忘特征的图
学位
意大利青霉是柑橘采后发生青霉病的病原真菌。在柑橘储运过程中,意大利青霉感染导致果实腐烂,造成较大的经济损失。目前主要采用化学药物防控柑橘病原真菌。常用真菌14α-去甲基化酶抑制剂(DMI)类型的杀菌剂包括咪鲜胺和抑霉唑。DMI类杀菌剂抑制真菌甾醇生物合成,破坏细胞膜功能而产生杀菌效果。长期施用化学药物导致抗药性菌株频繁出现。真菌抗药机制包括意大利青霉对DMI类药物产生抗性的机制逐渐成为研究热点。碱
学位
随着房地产市场的高速发展与日趋完善,购房者对便捷地获取准确地房产信息有着极为迫切的需求。因此,房地产估价是一项具有重要现实意义的研究工作,受到了人们越来越多的关注。现有的房产估价方法主要包括成本法、收益法与市场法。这些方法多注重于评估师定性分析,容易受到评估师的主观观念影响且难以快速批量地进行准确估价从而限制了这些方法在实际中的应用。近年来,随着统计方法与计算科学的快速发展,一些学者开始利用机器学
学位
社区,作为社会建设和管理的起始点和最贴近群众的基层组织,是政策措施落实的“最后一公里”,加强和优化社区管理具有十分重要的现实意义。我国的城市基层社区管理经历了发展和优化,其管理模式、运行方式实现了一定的发展,但对比新形势下社会转型的特殊要求、利益诉求的多样性和社会群体结构的多元化情况,还存在社区居民参与度不高、服务水平和能力不足、治理方式相对单一、社区运行制度和管理体制运行不够流畅等问题,还需要进
学位
小开放阅读框编码肽(SEPs)指由小开放阅读框(sORFs)直接编码产生的长度小于等于100个氨基酸的多肽。基于转录组测序技术和生物信息学技术预测存在大量sORFs,但对其编码产物SEPs的高通量研究较少。研究表明,SEPs广泛存在于不同物种中,且在应激状态下的细胞稳态维持过程中发挥着重要作用。对胁迫条件下SEPs的鉴定有利于了解SEPs的表达及其分子功能。因此,本研究利用基于质谱的蛋白质组学技术
学位
空间知觉是从人的认知结构中分解出来的不同于语言和逻辑思维能力的重要认知能力之一,空间知觉优秀的人通常具有优秀的创造力和想象力。方位知觉作为空间知觉的一种形式,是人类空间知觉能力发展的重要构成要素之一,也是儿童在解决复杂空间问题、几何问题和地理问题时,所需要的重要知觉能力。空间知觉能力是儿童正确认识客观世界的关键,因此,训练并提升儿童空间方位认知能力是必要的。现在一般训练方式是通过建构游戏培养儿童空
学位
嗜铁色囊藻NIES-1031是在2001年才被发现的一种单细胞蓝藻,可以在高浓度铁和高氧化环境中生存。前人对其分类特征、生理特性进行了研究,但是其在高铁环境中生存的具体分子机制目前还不清楚。了解该蓝藻在高铁离子环境中生存的分子机制有助于丰富对NIES-1031的认识,也有助于进一步认识铁在蓝藻中的作用。为此,本研究选用8 μM、40μM、400 μM、1,000 μM四种浓度铁离子的培养基培养嗜铁
学位
租金贷作为租赁企业的一种融资模式,自出现就深受资本的追捧。租金贷出现后曾对住房租赁市场的发展产生了促进作用,但从2018年起发生了异化,导致部分租赁企业资金链断裂,陆续“爆雷”的企业已超170余家,承租人、出租人等多方主体权利受到侵害,造成了严重的社会问题,进而引发社会各界的广泛关注。本文正是在此种背景下探讨租金贷模式出现异化的原因及在法律上的规制之道。本文除导论和结语外,正文由四大部分组成:第一
学位
自2009年比特币诞生以来,私人数字货币逐渐成为社会领域最热门的话题之一。作为货币体系和数字技术相结合的产物,私人数字货币的种类和功能也日益丰富,在推动金融创新和技术变革的同时,背后的风险也逐渐暴露出来,为政府监管带来了新的挑战。有鉴于此,本文着眼于在现有金融监管机制的基础上,结合私人数字货币的特点,为我国私人数字货币政府监管机制的构建提出建议。本文除导论外主要包括以下五个部分:第一部分是对私人数
学位