【摘 要】
:
随着互联网渗透到社会经济生活的各个领域,网络用户生成的文本数据量呈指数型增长。获取用户生成社交内容的方面级别情感倾向,对于舆情监控、推荐系统、商业决策、信息预测等方面意义重大。方面级情感分析(Aspect Based Sentiment Analysis,ABSA)成为自然语言处理的研究热点。然而方面级情感分析数据大多呈现出类别不平衡的情况,且现有用于方面级情感分析的深度学习方法缺少对文本语法信息
论文部分内容阅读
随着互联网渗透到社会经济生活的各个领域,网络用户生成的文本数据量呈指数型增长。获取用户生成社交内容的方面级别情感倾向,对于舆情监控、推荐系统、商业决策、信息预测等方面意义重大。方面级情感分析(Aspect Based Sentiment Analysis,ABSA)成为自然语言处理的研究热点。然而方面级情感分析数据大多呈现出类别不平衡的情况,且现有用于方面级情感分析的深度学习方法缺少对文本语法信息的利用,图卷积神经网络的提出为句法信息图表示提供了有效学习方法。因此,本文结合类别不平衡处理和图卷积网络,开展方面级情感分类方法的研究。主要完成工作如下:(1)针对方面级情感分析的数据样本中类别不平衡现象,提出欠采样和过采样相结合的自动权重估计采样法用于方面级情感分类任务中。该技术能够在不平衡数据集采样时自动估计抽样权重,重新平衡类分布;其优点在于无需创建新的平衡数据集,能够通过降低过拟合及数据特征缺失,提高方面级情感分析模型的分类准确率。(2)针对图卷积神经网络模型对文本上下文语义信息和局部特征提取不足的缺陷,提出在图卷积神经网络前加入串行的双向长短期记忆网络与卷积神经网络组合特征提取,以双向长短期记忆网络长距离上下文特征提取优势及卷积神经网络局部特征提取优势来弥补图卷积神经网络的不足。(3)结合基于句法编码及基于自注意力模型的优势,提出包含句法编码和自注意力模块的双输入图卷积神经网络模型,通过将依存句法分析编码得到的邻接矩阵与自注意力机制得到的注意矩阵分别输入到两个并行的图卷积神经网络中,使得模型能够更好学习文本句法信息及语义信息,从而使方面词与情感词建立更好的联系。(4)三个不同数据集的实验结果表明,该模型的准确率和宏平均F1值与相应基线模型相比均有1%至2%提升。此外,论文通过消融实验,验证了上述方法的有效性。
其他文献
<正>糖尿病在临床上属于比较常见的一种慢性疾病,其主要特征表现为高血糖,典型症状为多饮,多食,多尿,消瘦[1]。社区卫生服务是整个城市卫生服务中的不可忽视的重要组成,在《健康中国2030》的规划中,明确提出需要对健康服务体系进行调整并不断优化,加强对基层的重视。基于健康社区这一重要环节,开展多途径健康教育,提升患者健康生活质量,进一步稳定与控制血糖水平,对糖尿病疾病控制具有积极作用。本研究,对社区
女性时尚杂志的出现意味着女性对时尚理想生活的追求和自我意识的觉醒,封面是杂志引领潮流的重要窗口。在女性话语转向的今天,读者和杂志出版商对杂志封面的凝视逐渐从“女性”移向“男性”。女性时尚杂志封面所建构的男性形象离不开女性意识的觉醒、女性的性别想象以及消费文化和社会资本的推动。那么,今天的女性时尚杂志究竟呈现了什么样的男性形象?杂志所展示的男性形象背后又存在怎样的传播偏向或神话意涵?带着这些问题,笔
<正>彭博新能源财经发布的2021年《新能源展望》(NewEnergyOutlook)报告指出,为了在2050年前实现净零排放目标,全球需要173万亿美元的能源转型投资。2030年前,必须实现以下里程碑:每年新增505GW风电(为2020年新增风电装机容量的5.2倍)、每年新增455GW光伏(为2020年新增光伏装机容量的3.2倍)、每年新增245GWh储能电池(为2020年新增风电装机容量的26
为了解决电缆输入阻抗谱法对高阻故障定位距离较短、遮蔽区域大等不足,该文提出一种基于频域反射法的调频连续波(frequency modulated continuous wave,FMCW)电缆故障定位及类型识别方法。首先,依据FMCW电缆故障定位的原理结合电缆分布参数模型进行电缆故障定位仿真,获取电缆的FMCW幅值谱、相位谱。仿真结果表明,幅值谱可用于故障定位,相位谱可用于故障类型识别。根据仿真结
复杂跨越条件下互通式立交匝道曲线梁桥结构分析与优化是针对小半径曲线匝道梁桥的初步设计方案,本文运用Midas系列软件建立有限元分析模型,开展不同作用组合、工况条件和曲率半径匝道曲线梁的内力、位移、应力响应量的分析、模拟、计算和对比,获得各响应量的分布规律,确定最不利特征值;针对影响力学性能的主要因素提出相应的结构设计技术措施,以改善其结构性能,减小曲线梁“弯扭耦合”效应产生的不利影响,有效降低结构
目的 探讨以全程健康教育模式用于糖尿病患者的有效性。方法 以我院收治的74例糖尿病患者为研究对象,研究时间范围2019年7月-2020年6月,按照随机抽签法将患者分为两组,组别为参照组与研究组。参照组37例患者实施常规护理,研究组37例患者实施全程健康教育,比较分析两组干预前后血糖水平、疾病知识知晓评分、治疗依从性及干预满意度。结果 健康教育前,两组病人的血糖水平及HbA1c含量经统计分析差
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:如何从大量信息中找到自己感兴趣的信息或如何让自己生产的信息脱颖而出,受到广大用户的关注,均非常困难。推荐系统应运而生,而传统的推荐算法通常存在数据稀疏以及冷启动问题。知识图谱中存在大量的实体信息与这些实体间隐含的关联关系,并具有很好的扩展性;图神经网络作为一种提取
当前,随着国际分工的不断发展,出现了以产品内分工为基础的全球生产网络、全球价值链。东亚生产网络是世界三大生产网络之一,早期形成的东亚生产网络是以日本作为领头雁的雁型模式。随着中国对外开放水平的不断提升,中国东盟自由贸易区的建立,中国参与东亚生产网络的程度不断提高。2020年,东盟十国以及中国、日本、韩国、澳大利亚、新西兰15个国家,正式签署区域全面经济伙伴关系协定(RCEP),这将进一步促进东亚生
图结构数据广泛存在于现实世界中,节点分类是基于图结构数据的基本任务。由于各节点的度大小不一,且节点间的相对位置无序,所以常规的分类算法在节点分类任务上不适用或表现不理想。图神经网络(Graph Neural Networks,GNN)因为同时利用到节点信息和边信息,在节点分类任务上的表现突出,成为当前学术界的研究热点。其核心构建思想是,节点依靠图结构交互彼此信息以实现节点特征表示,通过特征表示学习
坚定不移地推进资本市场开放是我国经济金融发展的重要目标,防范系统性金融风险是金融领域的永恒主题。资本市场高水平开放意味着更大规模的跨境资金可以自由地流入流出,这将在一定程度上冲击我国人民币汇率稳定,进而影响到整个经济系统的稳定。因此,如何在推进资本市场高水平开放进程中维持人民币汇率稳定,对于防范境外风险输入、维护国家金融安全、构建高水平开放型金融体系以及推动金融供给侧结构性改革具有重要的研究意义。