基于Prompt方法的方面级别情感分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:alx0890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,互联网快速发展,人们逐渐习惯在社交平台上发表评论。这些在线上发表的带有情感的评论反映着大众对不同事物的喜恶。对带有主观情绪的评论进行情感分析能够帮助企业了解大众的对产品的需求,从而及时进行调整;同时能够帮助政府了解民情民意,从而能够在舆情发生的早期阶段进行及时地引导。情感分析研究按细粒度高低,分为篇章级情感分析、句子级情感分析和方面级别情感分析。方面级别情感分析相对于前两个粒度来说更加强调人们发表情感所指向的单一的对象。在现实生活中,经常会出现在同一个句子中,人们对两个对象发表相反情感的情况。这种情况下,篇章级和句子级的情感分析没有方面级别情感分析更适用于现实情况。方面级别情感分析包括方面词抽取、观点词抽取、方面词情感分类等子任务。深度学习技术大幅发展后,针对某一个子任务的研究相对来说更加丰富,将某几个子任务联合在一起解决的研究相对较少。在现实生活的场景下,能够一次性实现对文本的方面词抽取和方面词情感分类的方法,相对于只能实现某一个子任务的方法更加方便且节省人力。方面级别情感分析的难点在于如何识别存在于句子中多个主观情感指向的对象,以及如何识别对于不同方面词的情感极性。最近兴起的Prompt研究的核心思想是给模型以模板形式的提示,让预训练模型能更好地“回忆”起在预训练阶段已经学习到的知识。可见,这两者天生有某种程度的契合性,将Prompt方法与方面级别情感分析结合在一起,通过合理的设计,就能够让模型更加“理解”我们所询问的方面词。与此同时,方面级别情感分析由于其细粒度,对数据集的要求相对较高,标注的复杂性也相对提升。而Prompt能够在zeroshot和few-shot场景下也能发挥相对于其它模型更加优秀的性能。在本课题中,我们分别探索基于Prompt的方法构建方面词抽取模型、方面词情感分类模型,最后择优构建一次性解决两个子任务的联合模型。针对方面词抽取模型,我们分别提出了确定开始位置和结束位置的Pipeline模型和基于Prompt方法的判别器的后处理模型。通过构造合理的伪数据,判别器模型能够有效地识别BERT序列标注出的方面词中存在的边界错误问题,提升了模型整体的表现。针对方面词情感分类问题,我们基于Prompt的三种实现方式实现了方面词情感分类模型,并验证了其在zero-shot和few-shot场景下的实验效果。最后,我们将两个任务联合在一起,实现了Pipeline和Joint模型。因为在方面词抽取过程中采用的是后处理的方式,所以能将方面词视为一个整体,在进行判断时语义完整性相对于序列标注来说更强,从而也避免了使用序列标注实现联合任务不可避免地情感不一致性问题。基于Pipeline模型取得了相对于其他Baseline模型更好地结果。相对来说,Joint模型取得的效果一般,分析可能是因为两个子任务之间没有很强的耦合性,进行联合学习时会互相带来噪声,影响对方的学习。在Sem Eval2014中餐厅(Restaurant)数据集上的实验结果证明,Prompt与方面级别情感分析任务有较强的契合性,能够取得令人满意的效果。同时我们提出的基于Prompt构建的判别器后处理模型在方面词抽取任务上能够避免方面词边界错误和联合模型中的情感不一致性问题。
其他文献
葡362区块是松辽盆地大庆长垣中浅层扩边、增储的重点区块之一,葡萄花油层为研究区内主要的含油层系。葡362区块处于三肇凹陷永乐向斜向大庆长垣敖包塔背斜过渡处,其整体表现为构造特征多样、油水特征复杂和储层薄窄的特征,上述地质特征导致近年来新钻井成功率较低。因此,深入探究研究区葡萄花油层的油气成藏规律对老油田持续增储和稳产具有重要意义。本文利用研究区内钻井、岩心、测井和三维地震等资料,运用储层沉积学及
学位
走滑断裂对于油气圈闭的寻找具有重要的指导作用,小微断裂的发现与解释为油气勘探提供了新的方法,但是由于缺乏能够有效厘定走滑断裂连通状态的定量表征,导致部分实际生产过程失利。本文以沙垒田凸起的多条NE向雁列式走滑断裂带为研究对象,解析其几何学与运动学特征分析发现这些断裂带由晚期右旋走滑作用形成。以此设计系列性砂箱构造物理模拟实验的结果表明:厘定雁列式走滑断裂连接程度的定量表征只与雁列式断裂最大断距(D
学位
随着计算机技术的飞速发展,机器翻译系统取得了飞速的发展。对于尚不完美的机器翻译译文,自动评估技术是模型进一步优化和系统应用过程中不可或缺的技术。翻译质量在仅使用源语言和由翻译系统得到的机器译文的情况下便能够对译文的质量进行评估,因此在无参考译文的情况下被广泛使用。句子级翻译质量评估的目的是预测机器翻译的后期编辑工作量,这一工作量由HTER表示,即所需编辑(插入/删除/替换)次数与参考翻译的长度之间
学位
无论从历史事实还是教育史研究的角度,美国“教育民权运动”都可以被视为一场相对独立的教育运动。争取教育平权是撬动和推动民权运动的巨大力量,从政治家长久以来的政治抗争和法律斗争以争取外在的教育平等权利,到教育活动家克拉克等人的教育实践以推动弱势群体的内在教育赋权增能,二者相辅相成,最终对美国黑人及少数族裔的教育生态产生了重大的影响,并推进了美国社会文明化的进程。
期刊
探寻卓越小学教师核心能力及其培养是时代之需,符合教师教育的内部规律。卓越小学教师的核心能力充分体现为“四能”,即践行师德能力、胜任教学能力、有效育人能力和主动发展能力。通过“四维”(即导向职业认同的师德养成、基于学习共同体的师能提升、依托CCEP的育人智慧培育和立足PBL的发展能力培养)促进卓越小学教师核心能力的培养。在培养过程中,关键要通过教师教育治理结构的重构实现高校、政府、社会和中小学的协同
期刊
全面、及时地了解供水管网的工作状况至关重要,是供水企业制定科学、经济、合理的供水规划的前提和基础,直接影响供水企业的运营和发展。利用具有整合资源、操作简便、时效性高、贴合运行现状等特点的在线实时水力模型,能够区域化、可视化、一体化地宏观评估管网的实时状态,模拟多种工程方案,从而比选、确定满足条件的最优供水规划。在新建水厂输水管、新建单元配水管、新建区域联络管3种供水规划场景中应用在线实时水力模型,
期刊
新药研发是一项耗资巨大且周期漫长的系统工程。获得合适的分子表示是人工智能驱动的药物设计和发现的关键问题。常见的方法将分子表示为SMILES字符串、图、分子指纹等形式。这些方法通常视重原子(相对原子质量大于氢原子)为基本单位或是视整个分子为基本单位。但一个事实是,分子的许多性质是由某些特定的子结构所决定的。分子指纹包括了一些子结构的信息,但分子指纹并不具有分子的完整信息。例如子结构之间的空间关系就无
学位
河型转化机制研究对于分析河流沉积特征具有重要意义。曲流河和辫状河作为现今和地质历史时期最广泛的河流类型,同时曲流河向辫状河转化是一种较为少见的逆向河型转化,所以分析曲流河向辫状河转化的控制因素对现代水利防治和地下储层预测均具有重要意义。但目前曲-辫转化研究一直停留在河流地貌学的定性描述上,缺少多河流系统性曲-辫转化控制因素的定量分析。因此,本文选取不同地貌背景的松花江巴彦-通河段、佳木斯-同江段和
学位
目的 探讨磁共振动态增强成像(DCE-MRI)联合弥散加权成像(DWI)在宫颈癌分期中的诊断效能。方法 选取2020年5月至2022年5月临沂市中医医院诊治的89例宫颈癌患者为研究对象,患者全部经由病理检查以明确病情,并于术前行常规磁共振成像(MRI)检查及DCE-MRI联合DWI检查,以病理检查为“金标准”,统计分析不同检查方法联合使用对于宫颈癌分期的诊断效能。结果 宫颈癌高分化患者的药代动力学
期刊
<正> 小儿瘀血发热的起因,多系跌仆堕坠而形成瘀血。瘀血内聚,蕴酿蒸化,瘀阻腠理,卫阳被郁,则通体发热,遂成瘀血发热证。余临证之时,常留心观察,详询病史。凡患儿主证有发热,因跌仆堕坠致肢体肿胀、青紫,固定性疼痛,尤其小儿头部或股部内侧损伤作痛,(常易被医者轻视或忽视。)夜热偏高,睡中惊啼不安,舌有瘀点,舌下经脉粗紫或脉涩者,均按瘀血发热辨治,每获捷效。瘀血发热,常易化毒,热
期刊