基于依存关系和图卷积网络的方面级情感分析方法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:weilijay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种网络平台的快速发展,社交、外卖、直播、短视频等领域产生了海量的数据文本,对文本进行细粒度的挖掘和分析具有重大的社会价值和商业价值。相较于粗粒度的情感分析技术,方面级情感分析旨在分析句子中实体或实体某个属性的情感极性,具有更普遍的应用场景,引起了学术界和工业界的广泛关注。近年来,利用图卷积神经网络和依存关系,建模方面词与意见词之间联系的方法在方面级情感分析领域取得了极大进展。但现有研究仍存在考虑单词间的相对位置信息不足,句子和方面词间信息交互不充分等问题。针对上述问题,本文在现有研究基础上进行探索和改进,主要的工作包括:(1)考虑到情感极性预测结果受方面词与意见词间相对位置的影响,本文提出基于依存关系和旋转式位置编码的方面级情感分析模型(AS-DRP)。使用Transformer结合旋转式位置编码捕捉单词间的相对位置信息与语义信息,同时通过依存关系和多层图卷积网络捕获单词间的依存句法信息。然后,利用双仿射层交互两种信息,并采用门控机制进行特征融合,得到特征融合后的方面词表示。最后,将方面词表示与BERT获得的分类向量拼接,进行情感极性预测。通过在公开数据集上进行对比实验和案例分析,验证了模型的有效性和泛化能力。(2)考虑到句子和方面词间的复杂关系影响情感分类结果,本文提出基于依存关系和胶囊网络的方面级情感分析模型(DR-Caps Net),通过胶囊网络建模方面词和句子间的复杂关系,提升模型效果。首先采用BERT获得句子和方面词的词向量表示,多层图卷积网络提取句子的依存句法特征,与句子的词向量残差连接,获得带语法信息的句子特征。然后,将句子特征和方面词表示输入胶囊网络,通过方面感知归一化和胶囊路由引导机制,将句子中与方面词情感最相关的表示传递到情感类别胶囊,进行方面词的情感极性预测。实验结果表明,DRCaps Net模型在方面级情感分析任务中取得了较好的分类效果。本文工作围绕方面级情感分析任务展开,在基于依存关系和图卷积网络的研究上改进模型,提出了AS-DRP和DR-Caps Net模型,通过和近年来提出的模型在Laptop、Restaurant、Twitter数据集上对比,验证了模型的有效性。
其他文献
棉花(Gossypium hirsutum L.)作为世界上重要的油料和纺织作物之一,在农业和工业领域中均占据重要地位。随着科技的发展,机械化越来越多的应用到棉花生产中。棉花矮化品种具有株高降低、株型紧凑的特点,在抗倒伏、肥力耐受等方面具有较大的优势,并且可以通过合理密植增加棉花的产量,是实现棉花全程机械化的理想品种。但是由于棉花是异源四倍体,基因组比较复杂,所以市场上的矮化品种仍然相对较少。因此
学位
原子精确的银硫团簇是一类具有精确结构与独特光物理性质的纳米材料。目前,大部分银硫团簇在空气中难以长期稳定保存,并且表现出较低的发光效率,这严重制约了银硫团簇材料的开发应用。科学家们已经开发了众多策略来解决这些问题,例如配体工程、异金属掺杂以及团簇基组装等。其中,以银硫团簇为节点以及有机配体为连接单元,构筑高度有序的银硫团簇基金属有机框架材料(Silver-Chalcogenolate Cluste
学位
棉花是世界上主要的天然纤维作物、棉籽油和生物燃料产品的重要来源,但棉花生产遭受到干旱、高温、低温和盐碱等多种非生物胁迫,严重限制了棉花的产量和品质。新疆是我国棉花种植的主要地区,但因新疆常年降水量较少,导致棉花生产受到干旱胁迫,因此研究棉花抗旱机理对提高棉花的产量和质量至关重要。类Tubby蛋白质(Tubby-like protein)在植物抵御非生物胁迫和抵御病原菌中发挥着至关重要的作用。本论文
学位
计算机视觉中通常用图像处理技术对图像预处理和特征提取,其目的是消除图像中无关信息,现已广泛应用于工业、医学、军事等领域。图像边缘检测算法是基于图像的边界,标识图像的边缘部分,本文选取了2个使用最广泛的图像边缘检测算法进行并行化研究,分别是Sobel边缘检测与Canny边缘检测算法。嵌入式系统、CUDA架构均已适配了此类图像边缘检测算法,而国产DCU加速器件对此类图像处理算法的部署还是空白。为了在国
学位
棉籽油是我国第五大植物食用油,利于人体健康。磷脂-二酰甘油酰基转移酶PDAT是介导二酰甘油通过和磷脂胆碱上酰基相结合,从而合成三酰甘油的关键限速酶之一,这也是一条新发现的TAG合成途径。为了研究PDAT在棉籽油分合成中的功能,本研究克隆获得陆地棉PDAT家族成员GhPDAT2_2Dt基因,并通过在拟南芥中过表达初步验证了基因功能,通过酵母双杂筛选获得其互作蛋白GhDGAT3D,主要研究结果如下:1
学位
棉花是天然纤维的主要来源。黄萎病会引起棉花发育不良、叶片枯萎、维管束变黄等,对棉花纤维产量和品质构成严重威胁。棉花黄萎病防治困难且高抗黄萎病种质资源匮乏,对黄萎病的抗性机理研究是解决这一困境的有效手段。植物响应黄萎病菌侵染会产生大量的活性氧,而过多的活性氧也会对植物细胞造成损伤。过氧化物还原酶(Peroxiredoxin,Prx)可以降解细胞中过多的活性氧。OVATE Family Protein
学位
棉花是世界上重要的经济作物之一,果胶是纤维细胞初生壁组成的主要成分之一,起着连接纤维素、半纤维素和蛋白多糖的作用。UDP-葡萄糖醛酸是合成果胶和其他糖核苷酸的主要前体,是植物体内最重要的中间化合物之一。UDP-葡萄糖途径是合成UDP-葡萄糖醛酸的一条非常重要的途径,在植物,动物和微生物中普遍存在。UDP-葡萄糖焦磷酸化酶(UDP-glucose pyrophosphorylase,UGP)和UDP
学位
检测行人是否徘徊首先要对行人进行识别,再跟踪被检测到的行人,通过轨迹分析判断目标是否徘徊。然而当前算法难以满足高准确率、实时检测的需求,主要存在以下三方面问题:(1)现有检测算法对小目标特征提取能力有限,目标遮挡时存在漏检,不利于跟踪器进行多特征融合,影响跟踪效果。(2)现有跟踪算法在目标遮挡时会出现跟踪中断导致ID跳变,进而导致徘徊检测算法误判。(3)现有徘徊检测算法计算量大难以实时检测,而且对
学位
黄萎病是影响棉花产量和纤维品质的重要病害,主要由土传真菌大丽轮枝菌(Verticillium dahliae)引起。培育黄萎病抗性棉花品种是改善其防治困难的有效途径。本研究从大丽轮枝菌Vd991侵染棉花根部的转录组数据分析,筛选到候选基因GhERF109和GhPRA1.B1-1A。在棉花中通过病毒诱导的基因沉默(VIGS)技术及在拟南芥中过表达,对目的基因抗病功能进行分析,为植物抗病机理研究提供理
学位
在涉密电子政务应用的客户端,时常发生手机拍屏泄密事件。因此,如何通过拍屏图片溯源到泄密源头,阻吓拍屏泄密事件发生具有现实意义。将用户客户端信息(如IP地址,用户代码等)隐写生成可嵌入到客户端背景的图像水印,当泄密事件发生时,通过还原隐写信息,追责泄密者。然而,拍屏过程中由于拍照角度、光照、摩尔纹等影响,图像水印信息容易受到损害,给溯源带来了极大挑战。目前国内外隐写水印相关研究文献中,讨论手机拍屏隐
学位