基于依存树的方面级情感分析

来源 :安徽大学 | 被引量 : 0次 | 上传用户:snelgar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
方面级情感分析(Aspect-based Sentiment Analysis,ABSA),是实现一个句子中给定方面词的情感极性分类,常见的为情感三分类(即积极、消极和中立)。其在外卖评价、社交舆情分析、网购推荐、金融行情等领域中的应用屡见不鲜。在信息爆炸的今天,ABSA无疑拥有更广泛的应用场景和更广大的需求人群,具有重要研究价值和意义,因而在近年来被广泛关注。相关研究工作通常只关注方面词和句子序列的交互学习,得到句子语义信息的特征表示,缺乏对语法层面信息的使用。此外这些模型往往缺乏可解释性,并且没有考虑到不同的情感极性错误分类情况应给予不同的训练损失值。另一方面,将依存树信息中的依存关系用于方面级情感分类任务中,虽然可以提升模型的分类效果,但依存树本身存在噪声和数据集中的句子不符合句法结构两种情况,限制了模型分类效果的提升。对于以上问题,本人研究生期间进行了如下两项工作:(1)提出了一种将依存树信息作为辅助信息且具有一定可解释性的方面级情感分类模型,即结合语法信息的双向门控卷积模型(DT-BG-CNN)。使用词性信息帮助模型得到正确的词义表示,缓解模型由于英语单词中一词多义导致词义特征表示错误的情况。并用句法树中的依存类型信息辅助模型捕获句子中特定方面词的意见术语。提出增强损失函数用于模型的训练。在三个经典数据集上进行实验,验证了该模型和增强损失函数的有效性。与当前的一些预训练语言模型进行对比,结果表明该模型在得到单词词义正确表达方面的有效性。分别做了模型可解释性、句法依存类型信息作为权重的有效性、增强损失函数参数取值对模型训练效果的影响、模型的复杂度四个扩充实验。(2)考虑到依存关系的噪声问题和泛化性差问题,提出了注意力和依存关系交互学习模型(A-DT-ML)。一方面对依存树信息中存在噪声的依存关系图进行不信任处理,即对依存关系图进行了平滑处理,并使用图卷积神经网络获取了具有全局句法结构信息的上下文特征表示。另一方面对缺乏句法结构信息的数据集使用注意力机制替代依存关系图学习不同单词间的依存特征。两种特征根据依存关系可信度进行选择性结合用于分类。使用平滑惩罚损失函数进行模型的训练学习。在三个经典数据集上的实验结果表明,该模型的分类结果明显高于基线模型。通过三项消融实验结果,表明了模型中三项处理对模型分类效果起积极影响。另外做了四个扩充实验,对模型进行了进一步分析。
其他文献
针对土地利用(LU)数据因空间尺度或产品来源的不同从而对生态系统服务价值(ESVs)估算产生影响的问题,该文采用当量因子法、升尺度算法与波动性指数等方法,研究了长三角地区ESVs对LU数据的空间尺度效应。结果表明:(1)随着尺度的增加,LU的空间细节逐渐不明显,相同土地利用类型呈现出聚合的现象,但总体的土地利用类型空间分布相似。(2)不同尺度的LU数据估算出的各种生态系统服务功能价值与ESVs各不
期刊
汽车保有量逐年上涨,驾驶安全问题也越发严峻,降低交通事故发生率能够挽回大量的生命财产损失。在影响交通安全的因素中,驾驶员所占比例远高于车辆本身和外部环境。现今,计算机视觉技术的发展势头正盛,在目标检测、动作识别、图像处理等方面都取得了一定的成果。利用计算机视觉技术来辅助驾驶是一项极具现实意义和应用价值的研究方向。我们希望通过固定在汽车内的摄像头对行驶过程中驾驶员的动作进行监控,结合准确高效的算法进
学位
随着遥感设备和计算机技术的快速发展,高分辨率遥感数据的获取日益便捷,遥感技术已广泛应用在土地利用检测与规划、气候监测、城市规划、自然灾害避免、智慧农业和军事安全等领域。在这些领域中,需要依靠计算机视觉技术来分析理解高分辨率遥感数据,提高对数据的理解能力。语义分割作为基本的计算机视觉任务,是其他技术研究的基础,是遥感图像场景解析的重要研究部分。近年来,基于深度学习的卷积神经网络在图像处理领域发展迅速
学位
随着硬件计算能力的提升,实例分割领域中的瓶颈问题不再是大量的模型计算,而是昂贵的数据集标注成本。为了缓解实例分割模型在落地应用过程中标注成本高昂的困境,本文以低成本和快速的弱标注方式实现一种弱监督实例分割算法。在标注方面上,本文利用了在实例分割任务中自带的边界框和成本低廉的目标点两种弱标注,使标注信息在低成本下尽可能还原目标。在研究方法上,为了在实例分割模型中排除检测分支对掩码分支的影响,本文首先
学位
太浦河是跨两省一市的长三角生态绿色一体化示范区的空间骨架。目前发布的示范区国土空间规划草案已提出区域协同发展的目标,但从流域尺度的空间规划落实到场地尺度的规划设计尚缺乏中间层次的规划支撑,导致实际问题与解决策略之间的错位。浙大-西浦-同济联合Studio模拟了长三角生态绿色一体化语境下跨行政主体协作的跨学科、多尺度流域规划设计,回溯各个尺度,归纳原型设计策略作为系统性的规划设计导则,探讨在流域尺度
期刊
作为一种新兴的机器学习范式,联邦学习允许参与者在不暴露私有数据的同时协作建模,打破了“数据孤岛”的困境。然而,经典的联邦学习算法存在诸如通信开销高、无法实现个性化的协同训练等问题,使其难以大规模部署。针对上述问题,基于知识蒸馏技术的联邦蒸馏学习应运而生。通过聚合客户端模型预测而非模型参数,联邦蒸馏学习优化了联邦学习的通信效率,实现了个性化的协同训练。然而,联邦蒸馏学习可能受到来自恶意的中心服务器或
学位
图表示学习旨在学习节点低维特征表示,以应用于诸如节点分类、链路预测以及社区发现等节点级分析任务中,吸引了越来越多研究学者的关注。然而,现实世界中的复杂图数据通常表现出一种明显的层级结构,这一特性有助于提高图分析的质量。图层次表示学习的核心思想是以分层的方式聚合节点特征信息,并用低维稠密的特征向量表示图数据,从而可以使其更好应用于图分类等图级分析任务。面对规模愈加庞大的图数据,图简化技术可以在保持基
学位
随着网络时代的高速发展,真实世界中产生大量具有复杂关系且隐含重要信息的网络数据。挖掘网络数据中丰富的信息,对于网络分析具有重大意义。网络表示学习是一种在保持网络基本性质的基础上,通过映射函数将网络节点以一种低维稠密的向量形式表示的网络分析方法,这种向量表示结果可以应用于节点分类、推荐等网络分析任务,具有重要的研究价值。近年来网络表示学习取得巨大成就,在学术及工业界获得极大关注。现有方法大多可以将网
学位
结直肠癌是常见的恶性肿瘤,严重威胁人们的生命健康,而结直肠中的息肉被看作是结直肠癌的前兆,通过结肠镜检查可以有效的诊断出息肉或结直肠癌,但是人工的方式有一定的漏诊率。计算机技术的快速发展,使得开发出计算机辅助诊断(Computer Aided Diagnosis,CAD)工具成为可能,快速准确的息肉分割方法对诊断结直肠癌有着重要的意义。由于息肉本身的形状、颜色、大小变化很大,息肉分割一直是一项具有
学位
由于遗传密码存在的简并性,编码区中不影响蛋白质序列的单核苷酸突变被称为同义突变。同义突变在各种复杂人类疾病中起着重要作用。识别同义突变有利于人们对相关疾病的诊断与治疗。然而,精确识别有害同义突变仍然是一项非常有挑战性的工作。近十年来,一些基于机器学习的同义突变功能预测工具被提出来了。这些工作极大的促进了人们对同义突变的认识。在同义突变功能效应预测模型的构建过程中面临不平衡数据集的问题,已有的方法大
学位