基于交互式网络和外部知识的方面级情感分析研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:wangfeiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网海量评论数据越来越倾向于客观化、多角度化,准确把握用户对产品各个方面的情感极性具有重要意义。传统的句子级情感分析虽然能够针对某句话识别出其整体的情感倾向,但是当句子中存在对产品不同方面类别的评论时,句子级情感分析则不能满足识别特定方面词下的情感极性需求。方面级情感分析旨在识别出句子中针对特定方面词的情感极性,与句子级情感分析相比,方面级情感分析粒度更细,对于用户了解产品不同维度信息的应用价值更高。目前在方面级情感分析任务中,循环神经网络结合注意力机制的方法取得了较好的效果,但是传统的注意力机制无法将方面信息与上下文信息有效融合。其次,评论文本语言错综复杂,仅依赖于神经网络进行方面级情感分析难以弥补在情感常识知识上的空缺。因此本文提出了一种将交互式神经网络和外部知识模块相结合的新型方面级情感分析架构,并针对训练过程中存在的领域偏差和中性情感标签不可靠问题,提出领域联合训练和重构损失函数的方法。主要工作如下:(1)针对句子中方面词较多导致文本表达能力差的问题,设计了交互式神经网络模型,利用上下文感知的BERT作为词嵌入模型,并以多模式注意力机制完全替代循环神经网络,使模型可以有效提取更重要的信息,融合了方面词与上下文之间的文本表达。(2)针对语言复杂性的问题,引入外部情感知识,并通过知识图嵌入的方法建立情感知识网络,提高模型的情感感知能力以及推理能力,强化方面词与情感词之间的匹配。(3)针对模型在不同阶段领域适应性差的问题,首先对词嵌入阶段BERT的基准预训练语料库进行调整,采用领域相关的BERT-PT对原有模型进行二次训练;其次在训练过程中,本文采用领域联合训练的方法融合了两个不同领域的数据集。(4)针对训练样本中中性情感标签不准确的问题,提出重构损失函数,并在其中引入标签平滑正则化项,降低标签的绝对化,提高模型的泛化能力。利用所提出的模型在Sem Eval-2014 Task4的laptop和restaurant以及ACL 14twitter三个公用数据集上进行测试,实验结果表明该模型能有效提升方面级情感分析的精度,将其与其他先进模型进行对比,该模型依然具有一定的优势。
其他文献
债券受托管理人制度是保护债券持有人权益的组织性制度。债券受托管理人制度起源于英美法系国家,我国在2003年《证券公司债券管理暂行办法》中首次提出,以“债权代理人”的概念作为债券受托管理制度的雏形引入国内。在2007年《公司债券发行试点办法》中,以“债券受托管理人”全面替代“债权代理人”作为官方用语,粗略勾勒出我国现行的债券受托管理制度。2019年,《中华人民共和国证券法》和《全国法院审理债券纠纷案
学位
静脉血栓栓塞(VTE)包括深静脉血栓形成(DVT)和肺栓塞(PE)。围术期静脉血栓形成是导致患者严重并发症和死亡的原因之一。围术期VTE的预防,能降低患者的死亡率,但须考虑患者的风险和获益之间的平衡。为指导妇科医生在妇科手术中血栓预防,2021年Journal of Obstetrics and Gynaecology Canada发表了《Guideline No.417:Preventionof
期刊
党的十八大以来,随着我国知识产权法治的完善和保护力度的提高,诉讼成为商标权人的一种重要权利救济手段。据统计,2013年至2021年6月,全国法院审结商标案件43.7万件。对于绝大多数商标权人来说,通过诉讼维护了自身的合法权利。但对于部分“恶意”商标权人来说,诉讼反而成为了其实现牟利目的之工具,商标恶意诉讼不仅浪费了司法资源,还冲击社会信用体系,破坏了市场经济秩序,因此建立起一套明确有效的商标恶意诉
学位
企业生产一线经常会遇到各种工程难题,需要咨询具有相关研究的机构,或在专家及专家团队的帮助下才能得到有效解决。当前的学术资源推荐系统没有深入挖掘问题与解决方案之间的潜在知识关联,无法针对某一工程问题推荐出合适的专家。本文针对此问题做了以下研究:(1)专家合著网络结合作者次序信息计算专家影响力构成合著者之间的偏序信息。提出了融入合著者偏序信息的主题模型:APO-ACT模型,使作者-会议-主题模型(AC
学位
在信息爆炸时代,人们通过互联网获取信息时,往往需要花费大量时间来筛选和识别文本中的关键信息,因此,如何从大量信息中快速理解文本并有效地获得文本中有价值的信息已成为主要难题。自动摘要技术可以简化一个或多个文本,并将其精炼成包含关键信息的短文本,从而减轻人们的阅读负担。近年来,随着深度学习算法、大数据和硬件计算能力的飞速发展,序列到序列模型在生成式自动摘要任务中取得成功,并在学术界得到了广泛的研究。但
学位
长链非编码RNAs(long non-coding RNAs,lncRNAs)是一类长度超过200nt并且没有编码蛋白能力的RNA分子。鉴于lncRNAs具有复杂多样的调控功能,其已成为研究生物过程及人类复杂疾病的研究热点。由于lncRNAs具有低保守性、低表达水平和较高组织特异性等特点,目前只有极少数lncRNAs通过生物实验证明具有明确的调控功能,大多数lncRNAs的功能仍然完全未知。传统的
学位
报纸
“模因”是文化传播复制进化的一种单位,这为研究文化提供了一个全新的视角。语言本身是一种模因,模因寓于语言中。模因为语言的发展演化提供了一个新的理论维度。鉴于此,本文以模因论为视角,研究中英合同语言这一特殊的法律语言模因集合,以探讨模因对合同语言翻译的指导作用。基于此,本文选取中文合同及其官方英文译文,主要运用对比分析方法,定量与定性结合等方法,旨在分辨中英合同本身固有的词汇模因,句型模因以及语篇模
学位
中俄蒙三国元首于2014年9月第一次会晤时,国家主席习近平提议将“中俄蒙经济走廊”作为俄罗斯“跨欧亚大通道”、蒙古“草原之路”以及中国“一带一路”三大倡议的对接载体。此后,中俄蒙三国开展合作,在经贸合作、基础设施建设、能源合作、社会合作等方面取得了丰硕的成果。但因日益猖獗的传统和非传统安全威胁严重阻碍了中俄蒙经济走廊的建设,2015年7月9日,中俄蒙元首第二次会晤批准了《中华人民共和国、俄罗斯联邦
学位
伴随着认罪认罚从宽制度改革的顺利推进及少捕慎押慎诉政策的大力推行,检察机关在刑事诉讼特别是认罪认罚案件办理中的主导作用得以充分凸显,检察机关的起诉裁量权得到一定程度扩展,不起诉制度的适用越来越受重视。但从实际效果上看,认罪认罚案件适用不起诉的情况并不理想,不起诉制度并未充分发挥其独特的审前分流作用。这不仅有碍新时期刑事不起诉的理念调整与制度完善,也对我国认罪认罚从宽制度的功能发挥产生较大影响。鉴此
学位