面向用户在线评论的方面级情感分析方法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:yanghuayejuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,各种社交和电商网络平台进入了人们的生活,人们在享受网络即时性、便捷性的同时,也在网络上产生了大量的评论性数据。这些包含大量观点的用户在线评论数据蕴含着丰富的科研价值和社会商业价值,对这些数据进行观点挖掘和情感分析已成为自然语言处理领域中热门的研究领域之一。在对这些用户在线评论数据进行观点挖掘和情感分析的过程中,由于用户在线评论数据文本篇幅短,针对性强,包含多个特定方面的情感极性,需要更深层次的理解和建模。因此,方面级情感分析方法越来越受到研究者的关注。在方面级情感分析方法的研究进程中,相较于传统的基于情感词典和传统机器学习的算法,深度学习不依赖人工构建特征,通过神经网络自动学习提取特征,非常适合复杂的语言文本数据,已经成为了方面级情感分析的主流方法。基于此,本文采用深度学习方法构建方面级情感分析模型,对单领域和涉及迁移学习的跨领域用户在线评论数据进行分析,研究设计了两个方面级情感分析模型,论文的主要工作和成果如下:(1)针对单领域的方面级情感分析中,基于依赖树的图卷积网络模型在建模时对文本的依赖解析结果不准确,以及用户在线评论数据的非正式表达造成语法信息不充分的问题,提出了一种增强语法语义信息的双图卷积方面级情感分析模型。模型从语法和语义两个角度来开展研究,首先利用Bi LSTM作为句子编码器提取方面词和上下文的隐藏表示。然后,语法上,在先前通过依赖解析器输出的基础上,构造通过语法距离加权的依赖概率矩阵,再结合位置距离特征获取语法结构的有用信息,提高基于依赖树的图卷积网络的特征提取能力,解决了文本依赖解析结果的不准确问题;语义上,通过引入注意力机制获得一个注意力邻接矩阵再结合图卷积网络完成特征提取,解决了在线评论数据语法信息不充分的问题。再融合两个模块的特征信息,来提高基于语义和语法特征的网络模型对方面词情感极性的预测能力。最后,在三个公开的方面级情感分析数据集上和最新研究方法进行了实验,对比结果证明了该模型的有效性。(2)针对跨领域方面级情感分析中,特定领域训练的模型存在领域依赖性以及不同领域间存在分布差异性,造成模型泛化能力差的问题,提出了一种基于注意力机制和域对抗网络的跨领域方面级情感分析模型。首先,将方面词和句子组合成的句子对作为预训练模型BERT算法的输入。然后在特征提取层,利用依存句法知识和交互注意力机制进行改进,提高源领域和目标领域的特征提取能力,方便后续领域共享特征的获取。最后通过情感分类器模块对源领域数据进行情感分类,领域分类器模块实现源领域和目标领域数据的特征混淆,以对抗训练的方式来提高领域共享特征提取,解决领域依赖性和分布差异性,提高模型泛化能力。最后通过实验对比,验证了该模型的有效性。
其他文献
近年来,随着大数据、处理器计算能力及算法模型的发展,深度学习算法在很多应用中取得了比传统机器学习算法更好的效果。为了提高模型的普适性以及在实际应用中获得更好的训练效果,神经网络结构也越来越复杂,网络层数和参数的数量不断增加,用于深度学习训练的模型和数据集规模越来越大,使得深度学习的训练过程需要耗费大量的存储和计算资源,训练所需的时间也随之增加,对计算能力产生了更高的需求。而多核、众核、集群等并行计
学位
目的1.评估不同动物肩袖损伤模型用于探索自体骨软骨联合骨膜修复肩袖损伤腱-骨愈合效果的可行性,以选定最适宜动物模型。2.从整体水平、组织学水平及生物力学水平评估、对比自体骨软骨联合骨膜、自体骨软骨、自体骨膜及单纯缝合不同干预措施对肩袖损伤腱-骨愈合的作用。方法1.选定动物模型:解剖并观察小鼠、大鼠及兔的肩袖形态,选择合适的肩袖损伤模型;对不同动物膝关节非负重区、胫骨近端内侧面区域测量评估其取材可行
学位
<正>《普通高中数学课程标准(2017年版)》指出:"通过高中数学课程的学习,学生能提升数形结合的能力,发展几何直观和空间想象能力;增强运用几何直观和空间想象思考问题的意识;形成数学直观,在具体的情境中感悟实物的本质."[1]由此可见,学生直观想象素养的培养是十分重要的.本文从实践出发,探讨数学直观想象核心素养的培养策略.一、联系生活,重视几何模型的制作与应用几何模型是由现实世界中的物体经初步抽象
期刊
随着社会经济的不断发展和物联网技术的高速发展,车载应用与服务日渐丰富,同时用户对数据速率以及服务质量的要求不断提高,容易产生大量数据和回传时延低下等一系列问题,影响车联网的服务质量。作为传统云计算技术的一种补充与演进,边缘计算技术通过在靠近联网车辆的网络边缘部署资源,在极大减少云计算负载和和数据处理时延的同时,为车联网的应用提供了更好的支持。然而,车联网边缘计算技术仍然面临着一些挑战,边缘资源的配
学位
近年来,中国踏上社会主义现代化进程,党中央加大对交通领域的投资建设,城乡距离缩短进一步带动城镇经济的发展,但当前城市路网建设依旧处于发展阶段。随着购车热潮的兴起,道路交通基础设施建设速度与机动车保有量增速逐渐无法匹配,城市交通拥堵问题日益严重。精确、实时的交通信息预测能够感知和分析交通数据的演化趋势,是交管部门缓解城市交通压力的有效手段。当前,传统交通流预测模型在建模时缺乏对影响交通流的多方因素的
学位
随着城市智能化的逐步发展,室内定位技术的重要性和价值日益显现,且已然成为大众生活中不可或缺的一部分。然而,室内定位深度学习(Deep Learning,DL)模型在实时定位阶段极易遭受对抗样本攻击,室内定位系统的服务质量面临着重要挑战。并且随着室内定位动态环境不断变化,现有的室内定位DL模型无法保证实时性和准确性,在给个人和企业带来巨大利益的同时也存在着日益严重的安全问题。如何在抵御对抗样本攻击的
学位
目的本研究目的旨在探讨幽门螺杆菌(HP)感染所致的胃癌与非HP感染所致的胃癌之间是否存在差异,以表皮生长因子受体家族(ERBB受体家族)的表达作为主线进行研究分析。拟具体从HP临床检测手段、胃癌的临床特征、ERBB各分子的表达情况三方面进行对照研究。首先寻找能辨识HP感染确切可靠的分组方法、其次分析临床宏观特征之间的区别和差异,最后以经典的实验方法验证分析与胃癌相关ERBB家族的表达情况。最终试图
学位
目的:探讨金属基质蛋白酶在肾脏缺血再灌注中的作用,明确人脐静脉来源的外泌体对肾脏缺血再灌注损伤的保护作用。方法:选取生长至对数期的HUVEC使用含10%血清的1640培养基培养,获得其上清液,将所获得的细胞上清液置于超速离心机离心管中,之后使用密度梯度离心法分离外泌体,经梯度离心后获得人脐静脉来源的外泌体,并且经过透射电镜,粒径分析及外泌体标志蛋白的蛋白免疫印迹法检测证明获得的外泌体可用于后续的实
学位
研究背景:骨质疏松症(osteoporosis,OP)是一种骨科较为常见的疾病,各种类型的骨质疏松中以绝经后骨质疏松占比较高。绝经后骨质疏松性骨折及骨质疏松性疼痛困扰着全世界的女性,但其发病机制尚不明确。研究发现,感觉神经和其分泌的肽类物质降钙素基因相关肽(Calcitonin gene related peptide,CGRP)同时具有参与痛觉调控和促进骨生成的作用。此外,5-羟色胺也在痛觉调控
学位
公路作为带动区域经济发展的重要基础设施之一,对国民经济的发展具有重要作用。随着国家对交通强国的大力推进,遥感技术被用于公路沿线的环境监测。遥感图像语义分割可以帮助工作人员更好地掌握该公路沿线的地物,帮助开展公路沿线环境的动态监测及其安全分析工作,对于对地观测、环境监测以及灾害预警具有重要作用。近年来,基于深度学习的图像语义分割方法能够高效、准确地获取到所需要的图像语义信息,具有巨大的实用价值。然而
学位