基于深度学习的文本情感分析研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:dh5601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是自然语言理解的热门研究方向,是对含有情感信息的文本数据进行分析、处理和总结。传统的文本情感分析方法需要人工构造特征,耗费大量的人力和时间,比如传统情感词典分析方法。而机器学习算法对文本进行情感分析时,出现发掘信息不完整,获取文本数据特征稀疏的情况,例如循环神经网络。近些年,深度学习技术在自然语言理解领域取得了显著成绩,一定程度上能有效克服传统方法和机器学习的缺点,因此本文基于深度学习技术对文本情感进行分析。1.对于传统文本情感分析方法存在浪费大量人力时间制作特征问题,本文提出了S-Bi GRU-AT情感分析模型。该模型使采用Siamese体系结构创建了两个完全相同的子网络,每个子网络都包含嵌入层、双向GRU层和注意力层。利用文本处理包获取未带标签的数据集,进行词嵌入预训练,达到无需人工制作特征的目的。门控制单元GRU克服循环神经网络RNN建模时梯度消失和爆炸的问题。Context-Attention注意机制给每个单词注释分配注意力权重,反映出每个单词在文本中的重要性程度。本文将该模型应用于幽默文本对比情感任务,实现了在不依赖人工制作特征的情况下,对两个幽默文本的幽默度做出比较。2.对于机器学习在处理文本时发掘不出相关句法约束与长距离单词间的依存关系问题,本文提出了图卷积过度注意(ASGCN-AOA)模型。该模型利用GCN网络节点近邻特性对图中每一层节点表示进行编码和更新,引入语法依赖树绘制出与目标方面语法相关的单词,用于发现相关句法约束和长距离单词间的依存关系,而注意-过度注意(AOA)机制可以获得更多有效文本信息,减少稀疏数据特征对文本情感分析的影响。本文将该模型应用于方面级文本情感分析任务,不仅利用到相关句法约束与长距离单词间的依存关系,还让方面词与文本之间能够相互关注学习。
其他文献
技术可以从一篇或多篇文档集合中得到总结文章主旨信息的简短摘要,并要求在遵循事实的前提下保持一定的流畅性。基于深度学习的自动摘要方法更接近人们总结摘要的思想,但其研究深度还远远不够,有待进一步深化。本文主要研究基于深度学习的单文档生成式自动摘要,并完成以下工作:(1)应用文本主题信息的短文本摘要研究。提出一种基于注意力机制和双向长短记忆神经网络的主题信息增强的自动摘要模型,并导入指针机制以避免OOV
学位
文本语义表示是自然语言处理的核心内容,也是文本理解、处理和搜索任务中最基本的工作之一。传统的文本表示方法通常无法充分建模文本的上下文信息,导致文本结构信息缺失、文本语义获取不充分。基于神经网络的方法虽然能获得相对较好的结果,但是其可解释性较差,严重影响了它的应用范围。考虑到知识在人类大脑中通常是以联想记忆的形式存在,论文从人脑联想记忆视角出发深入探究知识体系的内在结构,以探索一种新的文本语义建模技
学位
阿尔茨海默病(Alzheimer’s Disease,AD)是导致老年人死亡的最主要原因之一。其早期阶段为轻度认知障碍(Mild Cognitive Impairment,MCI),主要表现为记忆减退,判断能力下降等。发展到AD阶段则表现为记忆严重受损,情感变得急躁等,甚至日常生活不能自理。该病危害严重,不仅给患者带来巨大痛苦,也给家庭和社会医疗带来巨大负担。目前AD尚无法治愈,对该病的预防和早期
学位
频谱分析在信号处理中起着关键性的作用,其数学理论是正交函数系。地图曲线作为一类典型的几何信号,具有形态结构复杂、应用领域广泛的特点。本学位论文通过引入一类新颖的完备正交系——V-系统,展开对以地图曲线为代表的复杂几何对象的频谱分析。主要研究内容包括:本文第一、二部分:主要以地图曲线为例,实现基于频域滤波的线状要素化简方法和群组地图曲线的多尺度表达。首先,介绍了V-系统的基本理论和构造方法,并利用其
学位
本文在制度分析理论和科学社会学理论的指导下,对当前期刊论文撤销制度进行了梳理,在参考已有研究的基础上建立了期刊论文撤销制度学术净化效果的影响因素模型,以Web of Science中1951年至2021年的9089篇撤销论文基本文献数据、引用数据及其对应的撤销声明数据为主要数据来源,进行了变量的选取和操作化,将撤销后被引比例作为期刊论文撤销制度学术净化效果的衡量因素,在控制作者数量、参考文献数量、
学位
机器学习尤其是深度学习技术促进着现代医学的发展,在很多疾病的诊断过程中起到了重要作用。传统机器学习方法需要大量的数据来训练算法模型,而在智慧医疗领域,由于数据的来源涉及患者隐私,很难获取海量的生物医学数据进行公开研究,这给机器学习技术在该领域的应用带来了诸多挑战。在该背景下,本文主要结合EEG脑电癫痫信号和新冠肺炎肺部CT图像这两种生物医学数据的自动诊断问题,开展面向生物医学数据的小样本分类方法研
学位
点云的特征检测是点云数据处理中最基础也是最重要的一个环节,数据处理中的多数算法都与点云特征提取有一定的关联,例如:点云的配准、分割、曲面重建、重采样等。其中,点云配准技术在计算机视觉中起着举足轻重的作用,并且广泛应用于三维重建、目标识别与跟踪、智能机器人等领域,具有重要的研究价值。传统的基于点特征的点云配准技术,无法保证对应关系的准确性和效率。随着对测绘成果的要求不断提高,对配准技术的要求也随之提
学位
环状RNA(circ RNAs)-RNA结合蛋白(RBPs)结合位点在许多生物过程中起着重要作用。因此,研究RBPs在circ RNA上的结合位点是至关重要的。虽然基于传统机器学习和深度学习的方法已被用于预测circ RNA与RBPs之间的相互作用,但对已有算法还未能充分学习circ RNA的相关特征,也未能进行高效的协作学习。针对上述问题,本文研究两种用于circ RNA-RBP结合位点的识别方
学位
服装解析由于其在时尚合成、姿态估计等领域的广泛应用而受到越来越多的关注。随着卷积神经网络的快速发展,现有的服装解析方法在卷积神经网络技术的帮助下也取得了优异的性能,极大地推进了服装解析任务技术的研究和应用。但是由于人体形态多变、服装类别多样、目标对象尺寸差别大以及对象边缘模糊等特点,现有的服装图像解析方法很容易产生错误解析结果,特别是在一些相似和细小的服装类别上。同时卷积神经网络自身也存在重复的下
学位
互联网的飞速发展以及信息采集、分享方式不断丰富促使人们步入大数据时代,数据的急剧增加带来严重的“信息过载”问题,推荐系统便是针对这一问题所提出的,推荐系统分析用户的行为记录,挖掘用户的个性化需求,帮助用户找到他们感兴趣但很难被发现的产品。如今网络内容日益丰富,物品数目动辄百千万计,用户交互数据非常稀疏,导致大多关联分析算法效果一般;由于新用户、新物品可供分析利用的信息较少,很难给出精准的推荐,从而
学位