融入句法结构信息的情感分析研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:soton0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下互联网信息技术的快速发展使得人们每天都会在网络中发表大量的文本信息,包括购物评论,电影评论和时事评论等,如何将这些文本数据中的情感信息提取并利用起来成为了人们关注的热点,文本情感分析也随之成为了自然语言处理领域一个重要的分支任务。文本情感分析是一项研究多年的任务,其主要目的是对带有情感倾向的主观文本进行理解分析,从中提取情感或观点的过程。基于深度学习的文本情感分析技术已经成为了该任务的主流方法,并且近年来预训练模型的出现更是大幅度地提高了大多数文本情感分析数据集上的最好结果。然而这些模型方法主要是对文本的序列信息进行编码,对文本的句法结构信息的利用还需要进一步地研究。因此本文将文本的句法结构信息融入到了深度学习模型中,并分别在句子级和属性级情感分析任务上做了实验探究。具体的研究工作如下:(1)在句子级情感分析任务上,本文提出了Tree-BERT模型。该模型以知识蒸馏理论中教师-学生模型框架为基础,将教师模型Tree-LSTM网络学习到的文本的成分句法结构信息以情感软标签的方式传递给学生模型BERT。通过该方法让BERT模型能够显式地学习文本的成分句法结构信息,达到了融入成分句法结构信息到BERT模型中的效果,并且进一步提高了单独使用BERT模型在Camera、Restaurant和Laptop三个句子级情感分析任务数据集上的表现。(2)在属性级情感分析任务上,本文提出了ASA-SAWRs模型。该模型将Biaffine parser模型产生的隐式依存句法结构信息表示融入到了本文提出的ASA模型中。该模型首次将文本的隐式依存句法结构信息应用在属性级情感分析任务上,同时进一步提高了ASA模型在Sem Eval2014数据集和Twitter数据集上的表现,缓解了依存句法分析器给模型带来的误差传播问题。本文还讨论了属性词的上下文中词语的词性对ASA模型在属性级情感分析任务上的影响,通过实验发现过滤掉原文本中那些词性不重要的词语也可以提高该模型在上述数据集上的表现。
其他文献
商用车驾驶室是整个商用车结构性能要求最高的部位,其结构性能以及可靠性直接影响整车生命周期以及车辆市场竞争力。本文基于多目标拓扑优化的结构优化方法,对商用车驾驶室白车身进行了结构优化,提出了轻量化方案并进行了分析。通过疲劳寿命分析,对方案的合理性进行了评估。首先,分析了国内外结构优化以及疲劳分析的研究现状与发展趋势,讨论了结构优化以及疲劳分析的主要方法。介绍了结构优化的基础理论,引入本文使用的多目标
学位
随着水利工程建设的不断增加,水利工程安全监测逐渐被关注,其中渗漏监测属于水利工程安全监测的重要组成部分,基于分布式光纤温度传感系统的渗漏监测方法的出现,为渗漏监测开辟了新的篇章,本文对如下内容进行了研究:(1)总结了渗漏监测的主要方法,并分析这些方法的优缺点,对分布式光纤温度传感系统应用于渗漏监测的优势进行详细介绍,该技术可以实现长距离、大范围渗漏监测,且抗电磁干扰能力强,耐久性良好。(2)研发了
对于大多数Android应用程序而言,图片加载行为是不可避免的。图片加载行为是计算密集型和内存密集型的操作,不恰当的图片加载行为会导致应用的性能低下,严重时可能会导致应用崩溃。现有的图片加载行为缺陷的分析方法集中在静态检测上,但由于静态分析的特性,结果可能会存在误报,需要额外的工作来验证结果的正确性。而由于图片加载行为缺陷主要表现在性能缺陷上,可能无法通过即时故障来体现,现有的Android应用的
无人机(Unmanned Aerial Vehicle,UAV)自从问世以来就被广泛应用到军事领域中。近年来,世界军事强国对防空力量的需求持续增加,进一步推动了无人机的研究和发展。为了使无人机隐身的能力得到提升,降低其雷达散射截面(Radar Cross Section,RCS)显得尤为重要。在面临复杂任务或者为了提高任务执行效率时,需要考虑多架无人机协同工作。无人机群的RCS随机群规模的增大显著
服务是Android应用的四大组件之一,主要运行在应用的后台,能实现多种功能。服务大多对用户不可见,但能长时间保持运行,发挥着重要的作用。当服务中存在缺陷或服务使用不当时,可能会导致应用崩溃、资源消耗快等问题。目前Android应用测试的相关研究主要关注Android应用的GUI测试方法。关于服务测试的研究较少,且存在一定的不足,难以发现应用运行时的服务使用相关缺陷。为解决上述问题,本文提出一种静
服装除了满足人们日常生活防寒保暖以及遮挡的需求,还反映了人们的时尚品味,更是不同个体身份和地位的象征。故越来越多的工作基于服装展开研究,例如:服装检索、服装推荐、虚拟换衣等,服装解析任务也应运而生。随着深度学习技术在计算机视觉领域广泛的应用,服装解析工作取得了一定的成功。然而当前服装解析工作为提高模型的解析性能,往往设计了复杂的网络结构或引用额外的辅助信息,导致参数量大、计算复杂等问题,因此并不完
环境感知是自动驾驶系统的核心技术,而可通行区域检测是环境感知的重要内容,对自动驾驶的路径规划有重要意义。高光谱图像因其对光谱感知范围广,包含感知对象材质相关的物理性质,一直以来在遥感领域和目标检测领域都有广泛的应用。本文主要研究基于高光谱图像的可通行区域检测,利用高光谱图像包含的感知对象的材质信息解决基于RGB图像的可通行区域检测中存在的问题,通过对高光谱图像进行道路分割实现可通行区域的检测,主要
随着人们对医疗健康的重视,药品的需求量不断增加,自动售药机行业迎来了新契机。为了抗击新型冠状病毒,积极响应疫情期间所提出的“无人接触”的号召,设计一款能够避免交叉感染的自动售药机系统势在必行。然而传统的自动售药机大部分存在运营管理难、药损率高、药品种类单一、监控难、交互使用体验差、测试难等问题,使自动售药机的发展受到限制。为解决上述问题,本文在传统自动售药机的基础上设计了一套基于B/S与C/S架构
软件产品的规模和复杂度随着互联网技术的发展与日俱增,使得交付高质量、低成本和易维护的软件产品难度增加,同时也增加了产生缺陷的概率。在软件产品发布之前,利用软件缺陷预测技术构建相关模型能够识别出软件中容易产生缺陷的模块,使公司合理分配有限资源以进行测试和维护,能够大大降低成本并提高软件质量。构建一个稳定高效的缺陷预测模型通常需要大量的类平衡缺陷数据集,但是在构建预测模型时,软件缺陷数据集通常面临两个