知识增强的情感分析关键技术研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:whywxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析作为自然语言处理的重要子任务之一,在学术界和工业界都受到了广泛的关注。该任务的目标是预测给定文本中用户表达的情感,情绪,观点和态度等。许多平台(如论坛、博客、社交网络、电子商务网站、新闻报道和其他网络资源)都可以表达观点,对这些观点的分析,可以用来理解用户对社会和政治事件、企业方针、经营策略及商品属性等的态度,从而进行舆情监控,改进公司产品和服务等。传统的情感分析算法,大部分基于人工规则、语法信息和机器学习算法,严重依赖外部工具和特征质量。近年来,随着神经网络在各种自然语言处理任务上取得成功,深度学习模型也被广泛地应用于情感分析任务中,并取得了很好的效果。目前的情感分析系统主要是数据驱动,根据大量特定领域标签数据训练神经网络模型,侧重通过对文本匹配的显式情感分析。这些工作把情感分析任务当做一个特殊的文本分类任务对待,忽略了情感分析任务本身的特性。情感分析任务是一个非常复杂的问题,具有情感表达的歧义性和含蓄性等特点,导致该任务中存在的几个亟待解决的问题:第一,情感分析往往涉及大量的领域,不同领域之间用户情感的表达也非常的不一致,导致迁移学习的效果不理想;第二,目前情感分析数据集由于标注成本很高,数据量很小,不足以学习领域情感知识,大大的限制了深度学习模型的效果;第三,大部分的工作关注构建领域通用或者独立的情感字典,而一些中性但在不同上下文中表达不同情感的词(如“快”、“热”等),即情感常识知识,被目前的工作所忽略;第四,目前大部分工作关注浅层的情感识别,缺少情感推理,无法预测深层的情感。而这些问题存在,主要是由于目前的模型缺少领域情感知识和常识情感知识所引起的。因此,针对以上情感分析任务中的不足,本文分别从预训练、迁移学习、无监督情感常识抽取、结合外部知识的情感推理等角度进行深入探究,对现有模型进行隐式和显式地知识增强,在准确率上得到明显的改善。具体来讲,本文的主要贡献总结如下:(1)针对前述第一个问题,提出基于预训练的跨领域隐式情感知识建模算法。本文探究了基于文本中大量领域不变的情感知识预训练对于跨领域情感分析的有效性。本文提出了情感感知的掩盖语言模型以及单词和句子级别的情感感知的预训练目标,使得模型学习文本中包含的情感知识。实验证明,该预训练模型可以极大的提高模型在跨领域情感分析模型上的准确率。(2)针对前述第二个问题,提出基于层次迁移的领域内隐式情感知识建模算法。本文尝试将同一个领域句子级别的情感知识迁移到方面级情感分析任务中。本文将模型在采样得到的领域相关句子级别情感分析数据集上进行预训练,并在数据集较小的方面级情感分析任务数据集上进行微调,并探究了模型每一层对于最终情感分析的影响。通过大量实验证明这种迁移的方式可以大大提高方面级情感分析的效果。(3)针对前述第三个问题,提出无监督的显式情感知识构建算法。本文探究通过无监督的方式抽取文本中包含的情感知识,如“快”对于物流表达一种积极的情感,而对于耗电表达一种消极的情感。本提出了基于离散和基于连续两种扰动方式,抽取出修饰方面的观点词。人工评测和自动评测都表明本文的模型可以有效抽取文本中的情感知识。(4)针对前述第四个问题,提出基于图推理的显式情感知识建模算法。本文探究了基于情感知识和语法结构的情感推理对于方面级情感分析的有效性。本文提出用图神经网络对句法信息和情感知识进行分开和联合建模,从而进行更好的情感推理,取得了较好的性能。
其他文献
电子封装技术微型化密集化发展,使得焊点尺寸急剧减小,这将造成钎焊回流时焊点内过冷度增大、焊点界面处元素交互扩散作用增强,再加上焊点界面反应“尺寸效应”,从而使焊点钎焊界面金属间化合物(Intermetallic compound,IMC)层厚度急剧增加。由于IMC的脆性,使焊点的可靠性面临严峻挑战,因此如何有效抑制焊点界面IMC的过度生长,提高焊点可靠性,成为决定先进封装技术微型化发展的关键。本文
惯性导航系统是一种抗干扰能力强的自主式导航系统,在卫星导航系统使用受限的环境下能起到重要作用。作为惯性导航系统的核心部件之一,目前在用的陀螺仪无法兼得高精度与小型化,从而限制了惯性导航系统的发展。得益于微加工技术的发展,核磁共振陀螺仪可以兼顾高精度和小型化,相比其他陀螺仪具有更大的发展潜力,目前已成为惯性导航领域的研究热点之一。当前核磁共振陀螺仪的研究主要聚焦于性能的提升和小型化的方案设计。本文则
自噬及自噬相关基因在免疫细胞发育及免疫应答过程中发挥着重要作用。Autophagy-related gene 7(ATG7)、Autophagy-related gene 10(ATG10)是自噬小体形成和延伸过程中的重要组分。正常状态下,体内需要基础水平的自噬来维持正常的细胞功能。应激状态下,自噬循环利用大分子进而为细胞存活提供能量和物质来源。越来越多的研究表明自噬相关基因也可在自噬途径以外发挥
河口湿地由于具有形成和发育过程特殊、环境特征独特、人口密集、生态系统服务功能众多、生物多样性丰富等特点,一直是海岸带研究的热点区域。咸淡水交汇的特殊地理位置,径流、潮流共同作用,使得河口湿地水文过程成为维持区域物质循环、能量流动的重要过程,同时对河口湿地生态系统物种多样性具有重要的塑造作用。本文以长江河口为例,通过历史数据搜集与整理、遥感影像与海图的分析和处理、野外固定样地观测等方法分析不同时空尺
在自然界中,生物大分子的显著特征之一就是其结构的复杂性。数以万计的原子以复杂的三维构型聚集在一起。结构的复杂性对于体内环境的有序调控起着至关重要的作用。人工设计并构建的生物大分子应具有强大的功能性,并且可实现自定义设置。建立具有明确结构的可实现特定功能的人工分子,一直是科研工作不断追求的目标。使用核苷酸或核酸分子构成的生物分子聚合物,弥补了传统无机纳米材料没有特异性识别功能的缺陷,这为体系中各个分
工程装备在运行的过程中会产生不同程度的振动噪声,剧烈的振动噪声不仅会造成工程结构的失效破坏,更重要的是会影响人们的日常生活。因此减振降噪在实际工程领域具有重要意义。由于外部激励以及结构系统自身的复杂性,噪声在不同频率范围内具有不同的表现形式。低频范围内的噪声频谱分布比较明晰,高频范围内则呈现出均匀化的趋势,而中频区间恰恰表现出了二者混合的特点。另一方面,对于低频和高频噪声分析工作,分别已有较为成熟
城市是大部分人类现在和未来生活的地方。全球快速的城市化不仅带来了经济和科技的高效和集聚,也带来了社会、环境和资源等方面的一系列城市问题。二十一世纪以来,全球国家、地区和组织都开始致力于解决城市发展问题,研究城市发展的科学途径,提出了“可持续发展目标(Sustainable Development Goals,SDGs)”、“新型城镇化”及“城市高质量发展”等目标或战略,科学测度城市发展状态作为其中
相互作用可调控的超冷费米气体为研究强相互作用的物理提供了很好的实验平台。特别地,当表征碰撞相互作用大小的低温散射长度可利用所谓的Feshbach共振调控为无穷大时,实现量子力学所容许的最强相互作用的量子气体,这确保了气体的行为与粒子间相互作用的微观细节无关,表现出与各种强相互作用系统相同的普适热力学性质。强相互作用的双组分费米气体是自然界其他奇特系统的原型,包括高温超导体、夸克胶子等离子体和中子星
从我国科研院所设立与分布来看,我国科研体系已具备相应的规模以及相对独立的研究体系。农业科研院所是农业科学院下属的直接参与到农产品技术研发、食品科学技术研究的国家级科研部门,其是我国农业科研的关键部门,也是中坚力量。随着经济的快速发展,我国农业科研力量不断壮大,对建设地区农科研院所所需设备、经费、技术和政策的支持力度不断提高,为我国农业科技研究与创新提供更有利的外部环境。我国农科研院所团队的建
期刊
模型验证是一种重要的自动化验证技术。给定一个软件或者硬件模型和相应的安全性质,模型验证技术可以自动化地验证模型是否安全,从而保证软件或者硬件系统的可靠性。该技术自提出以来就受到了广泛地关注,并很快被工业界应用在了实际的硬件设计及软件开发中,相应的模型验证工具也如雨后春笋一般层出不穷。然而,除了大型企业会为它们的特别需求设计专门的模型验证工具之外,在普通的硬件设计和软件开发流程中,模型验证技术的普及