基于深度学习面向目标的意见词抽取

来源 :江南大学 | 被引量 : 0次 | 上传用户:RyanD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
方面级情感分析是文本情感分析任务的研究重点,其基础子任务包括:目标词抽取、意见词抽取和方面级情感分类。传统的目标词和意见词抽取工作是独立完成的,割裂了目标词与意见词之间的联系。针对上述问题,最近的研究工作提出了面向目标的意见词抽取任务,其旨在根据句子中特定的目标词抽取与其对应的意见词。当一个句子中存在多个目标词时,准确的捕捉目标词和相应意见词之间的联系仍然非常具有挑战性。本文针对面向目标的意见词抽取任务进行研究,主要的创新工作如下:(1)目前面向目标的意见词抽取方法集中于依赖语义特征完成任务,没有考虑到句法特征。针对这一问题,本文联合图卷积网络(Graph Convolution Network,GCN)和图注意力网络(Graph Attention Networks,GAT)对融合目标词语义特征的神经网络模型(Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling,IOG)进行改进,设计了IOG-GCN-GAT模型。首先使用IOG学习特定于目标词语义特征的上下文表示;随后使用GCN和GAT充分挖掘句法依存树中的句法信息;进一步地,拼接每个单词的语义特征和句法特征得到最终的上下文表示;最后使用softmax完成面向目标的意见词抽取任务。通过补充句法监督信号,模型有效提升了面向目标的意见词抽取效果。(2)IOG-GCN-GAT模型使用的句法依存树是对句子解析而得到的,因此句子中不同的目标词使用的是相同的句法树,这导致模型无法充分利用目标词的特征。针对上述问题,本文集成双向长短期记忆网络(Bidirectional Long-Short Term Memorry,Bi LSTM)和在面向目标的句法树(Aspect-oriented Dependency Tree,ADT)上建模的双向图卷积神经网络(Bidirectional Graph Convolution Network,Bi GCN),提出了Bi LSTM-ADTBi GCN模型。对于每个特定的目标词,模型根据句子的依存句法树,构建以目标词为中心结构树。首先使用Bi LSTM学习上下文语义特征,随后使用Bi GCN在ADT上挖掘句法特征。Bi GCN能够自上向下的把目标词信息传播到上下文中,并自下而上的把上下文信息聚合到目标词。实验结果表明,Bi LSTM-ADTBi GCN能有效提升面向目标的意见词抽取效果。(3)上述模型引入句法信息十分依赖句法解析器,而句法解析器的解析结果并不是最高效的。针对上述问题,本文在IOG模型的基础上,集成了一种在Ro BERTa预训练模型诱导树(FT-Ro BERTa Induced Tree,FRIT)上建模的图卷积神经网络(GCN),提出了IOG-FRITGCN模型。具体来说,根据面向目标的意见词抽取任务对Ro BERTa完成微调后,使用扰动掩码策略探测出的更契合任务需求的句法结构。相较于普通的句法树,FRIT能够更有效的缩短目标词和意见词的距离。实验结果表明,IOG-FRITGCN能有效提升面向目标的意见词抽取效果。
其他文献
随着人工智能技术的迅速发展,行人重识别逐渐成为计算机视觉领域热门的研究课题,其作为智能视频监控系统中的重要组成部分,可以帮助从候选集中检索出待查询行人的所有图像,从而减少大量的人力成本,具有巨大的研究意义和应用价值。然而,由于背景杂乱、遮挡、图像质量低和相机视角等复杂的影响因素,给行人重识别带来了严峻的挑战。目前,主流的基于图像的行人重识别方法主要研究如何从捕捉到的监控图像中提取更具有判别性的行人
学位
特征选择旨在通过去除冗余、有噪声和不相关的特征,找到一组简捷且具有良好泛化能力的特征,由此提出的相关算法已广泛应用在生物信息学、数据挖掘和机器学习等领域。基于是否使用标签,特征选择方法可分为有监督学习,无监督学习。本文分别从无监督和有监督领域探讨了不同特征选择方法的性能,主要内容包括:首先,给出了联合不相关回归和非负谱分析的无监督特征选择(JURNFS)模型,JURNFS在选择不相关且具有判别性特
学位
遗传规划算法(Genetic Programming,GP)是一种典型的智能优化算法,它可自动生成解决问题的计算机程序及其他复杂结构,从而解决各类优化问题。GP模拟了种群的演化过程,采用选择、交叉、变异等遗传算子优化种群中的个体,以适应值为导向寻找最优解。然而,GP存在早熟收敛及代码膨胀等问题,这些问题将对解的质量产生重要影响。因此,针对GP存在的上述问题,本文展开了以下研究工作:(1)早熟收敛问
学位
不相关并行机调度问题(Unrelated Parallel Machine Scheduling Problem,UPMSP)是现代工业生产中普遍存在的一种车间调度问题,广泛应用于通讯设备制造、窑炉煅烧制造、纺织制造以及其他工业活动中。在不考虑其他约束条件下,它通常要求将一组数量有限的作业分配到一组数量有限的机器上,同时确保一个或者多个关键目标值最优。然而,实际的工业生产需要考虑大量的其他因素:例
学位
多目标优化问题(Multi-objective optimization problems,MOPs)在科学研究和工程领域广泛存在,研究者提出了许多经典多目标演化算法(Multi-objective optimization evolutionary algorithms,MOEAs)来求解MOPs,且取得了一定的成效。然而,MOEAs无法在求解决策变量数大于100的大规模多目标优化问题(Larg
学位
人脸检测技术是指一种从给定图像中识别出所有人脸,并返回对应的人脸边界框的技术,是当前计算机视觉领域的热点研究内容之一。目前人脸检测技术已被广泛应用于智能手机的美颜拍照、刷脸支付以及小区的安防门禁等应用场景中。尽管人脸检测技术在最近十多年里已经发展得比较成熟,但它在无约束环境下的性能仍然有很大的提升空间,同时在移动设备上的性能和检测速度也不令人满意。因此,人脸检测技术仍然存在着深入研究的学术价值和工
学位
相比于多目标优化问题(Multi-Objective Optimization Problems,MOPs),同时考虑目标数大于3的高维多目标优化问题(Many-Objective Optimization Problems,MaOPs)更符合实际应用。随着目标个数不断增多以及目标问题的复杂度增加,目前的多目标优化方法无法很好的解决高维目标空间中性能退化问题,如无法很好的筛除性能差的支配抵抗解(D
学位
脑肿瘤是一种常见的神经系统疾病,可分为原发与继发两大类。其中原发性脑肿瘤起源于颅内组织或脊髓病变,而继发性则是由其他器官的恶性肿瘤转移而来。相较于继发性脑肿瘤,原发性的发病率和死亡率更高,其中最为常见是胶质瘤,它起源于颅内胶质细胞的异常增生。尽管神经胶质瘤研究取得了相当大的进展,但患者的诊断仍然很差。准确的脑肿瘤分割是诊断和治疗的前提,这项任务的主要挑战在于胶质瘤及其子区域在外观、位置和形状上具有
学位
分布式传感器网络在单传感器滤波的基础上,利用传感器间通信交换多目标后验分布,对多目标后验分布进行信息融合达到提高多目标跟踪精度的目的。受限于单传感器检测能力、监控视野非完全一致以及复杂环境下目标漏跟或杂波干扰,传感器间滤波后验分布差异较大,直接采用广义协方差交集(Generalized Covariance Intersection,GCI)融合易丢失目标分布信息,探索有效的多传感融合方法仍值得深
学位
视频多目标跟踪是计算机视觉领域的一个重要分支,如今视频目标检测技术日益提高,现有目标检测器对单张图片中的物体类别以及物体位置有较高的识别率,但依然会有漏检测和错检测的产生。针对这一问题,视频多目标跟踪技术可以利用视频上文信息,对目标的运动信息以及外观信息进行建模,并用各自的标签标记身份来记录目标轨迹信息,可以减少检测器的误检测和漏检测问题。同时视频多目标跟踪技术还需解决如何有效识别新生目标、如何进
学位