【摘 要】
:
针对用户评论情感分析,基于传统机器学习的模型已经不能满足人们对于结果精确性的要求。而在深度学习的方法中,基于序列学习的神经网络模型往往重视文本局部语义的信息,忽视了文本的结构信息对情感特征表达的影响,如转折词、句法信息等。神经网络的相关研究中,与基于序列学习的模型相比,基于图学习的神经网络模型可以捕获数据的结构信息。图卷积网络作为图学习模型的代表之一,已在图任务上取得了良好的成绩。利用文本图表示文
论文部分内容阅读
针对用户评论情感分析,基于传统机器学习的模型已经不能满足人们对于结果精确性的要求。而在深度学习的方法中,基于序列学习的神经网络模型往往重视文本局部语义的信息,忽视了文本的结构信息对情感特征表达的影响,如转折词、句法信息等。神经网络的相关研究中,与基于序列学习的模型相比,基于图学习的神经网络模型可以捕获数据的结构信息。图卷积网络作为图学习模型的代表之一,已在图任务上取得了良好的成绩。利用文本图表示文本,将图卷积网络应用于文本图上,可以过滤与中心节点无关的节点特征,保留文本全局的情感信息,从而提高模型在情感分析任务上的准确率。本文的主要研究工作如下:(1)基于注意力机制的CNN和RNN模型因易忽略句法上关联词之间的句法依赖关系,而限制在用户评论文本上进行情感极性标注的性能。针对这一问题,本文提出一种基于句法图的图卷积网络的情感分类模型SCGCN。首先根据句子的依赖树得到词语间的依赖关系,以捕捉文本的整体结构特征,并利用双向长短时记忆网络从文本中提取句子表征;其次利用图卷积网络结合依赖关系对句子表征进行编码得到节点表征;然后结合注意力机制,利用节点表征重新分配句子表征的情感权重,并输入到全连接层,最终通过判别器判定句子的情感极性。实验结果表明,在处理用户评论情感的两分类和多分类标注任务时,SCGCN模型具有较高的准确率和良好的泛化性能。(2)基于序列学习的CNN和RNN模型因存在忽略文本中非连续和长距离语义信息,在情感分析任务上表现欠佳。而在利用静态向量表示多义词时,词语的上下文语境会被忽略。针对这两个问题,本文通过引入预训练语言模型BERT,提出一种基于序列图的图卷积网络情感分析模型SGCNSA。模型首先利用BERT对文本分词并生成词向量和句向量;其次,通过设定模型共现窗口遍历句子序列构建含有文本结构信息的文本图;然后,利用双向长短时记忆网络从词向量中提取句子表征;紧接着,GCN根据文本图编码句子表征得到具有结构信息的节点表征并与BERT生成的句向量拼接后送入全连接层;最终,通过判别器判定情感极性。实验结果表明,SGCNSA的评论情感两分类和多分类标注准确率均高于对比的学习方法。
其他文献
随着我国公路交通建设的不断完善,交通网络四通八达,交通建设的重心逐渐转移到道路养护上。混凝土作为重要材料被广泛应用于道路修建中,混凝土结构的设施由于长期受负载承重、恶劣环境的侵蚀以及施工工艺质量等因素的影响,导致路面容易出现裂缝病害,缩短混凝土设施的使用寿命,存在巨大的安全隐患。传统的检测方法依靠人工视觉检测或者选用无损的传感器进行辅助检测,要求检测人员具有相关的技术和经验,但是这种检测方法效率低
随着现代化的发展,国际间的交流日益开放、紧密,伴随着我国经济大环境的影响和国家政策的支持,旅游产业和体育产业之间的联系越发紧密,开始出现逐步融合发展的趋势。但是目前我国体育产业和旅游产业的交流融合尚处于浅层次的阶段,有关这两类产业融合发展的研究仍然较少,相关研究尚且不够深入。该文从理论角度分析了体育和旅游产业融合发展的制约因素和动力保障,籍此为我国体育和旅游产业进一步融合发展提供相关的参考和建议,
压电材料作为应用比较广泛,产量较大的一类功能材料,在对环保要求越来越高的当下社会,其无铅化成为了一项迫切的需求。而BaTiO3(BT)基无铅压电陶瓷是目前被研究较多的三类压电陶瓷中的一类,通过对其A位和B位离子掺杂,发现压电性能得到极大的提高,并且同时具备典型的铁电性能和优异的介电性能。有望实现实际应用,替换掉有毒的铅基压电材料。本论文选取了其中研究较少的Ba0.85Ca0.15Ti0.9Hf0.
狼儿峪村是平西地区最早建立起党支部的地方之一。1938年3月,昌宛联合县政府在狼儿峪村成立,先后建立党组织和抗日政权,建立民兵队伍,开展游击战争,指挥平西地区的革命斗争,为革命的胜利作出了不可磨灭的贡献。
离子渗氮是一种清洁高效的表面改性技术,能够显著提高表层硬度、改善耐磨性。常规离子渗氮处理后,渗氮层特性随离子渗氮工艺的改变通常具有这样的变化规律:随渗氮层增厚,化合物层、扩散层及有效硬化层都增厚,同时伴随表层硬度提高。遗憾的是:化合物层增厚将导致渗层脆性增大,对于承受冲击和重载磨损的零部件,如热冲压模、热锻模及重载齿轮等,常规离子渗氮处理常常存在渗层特性与服役要求冲突的难题,即随渗氮层增厚,表层硬
人体行为识别是机器视觉和人工智能方向的研究热点之一,成果已应用于人机交互、生物识别、健康监测、视频监控系统、体感游戏、机器人技术等领域。本文致力于研究基于时空特征表示的人体行为识别算法,主要包括关键帧算法、深度时空能量特征表示和整体协同时空特征表示算法。本文内容如下:一、针对深度图序列中冗余信息过多的问题,提出一种关键帧算法。首先对深度图序列相邻帧之间做差分处理,得到差分图像序列;然后求取差分图像
火龙果在我国种植面积大,产量多,品质高,但食用方式单一,精深加工不足,造成大量鲜果浪费,以罗甸红心火龙果为原料酿造的火龙果酒不仅大大延长了市场供应期,还将火龙果营养价值与酒特殊风味完美结合。然而,火龙果自身有机酸和酯类芳香因子等风味化合物含量较少,因而生产出的火龙果酒由于风味不足,往往难以满足消费者的需求。为提高火龙果酒香味复杂度与品质,将德尔布有孢圆酵母(Torulaspora delbruec
安全帽在环境复杂的施工场所是工人最基本的安全防护装置。然而国内工人素质参差不齐,许多工人未按要求佩戴安全帽,所以在施工现场自动检测工人是否佩戴安全帽对安全生产具有重要意义。近年来,已有不少针对于安全帽佩戴检测的研究,但是大多数研究方向旨在提高直立条件下安全帽的识别率,对于施工人员复杂姿态下的安全帽佩戴检测的研究相对较少。本文结合当前研究热点与具体实际应用背景,引入人体姿态估计算法进行安全帽佩戴检测
基于骨骼的动作识别因不受人体物理特征的影响以及潜在优势,可以简单、清晰地传达人体行为识别的重要信息,已经成为了计算机视觉这一领域的活跃主题。然而传统的应用程序骨架建模通常依赖遍历规则的人为设置而导致表达能力有限和推广困难,以及部分方法未着重关注动作识别过程中身体部位之间的运动联系而导致的识别效率未达预期。针对这些问题,本文提出了基于ST-GCN的不同改进方法,主要工作内容如下:(1)在ST-GCN