基于深度学习的细粒度情感分析研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:wumingwuming2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,用户越来越多地在电商平台或者社交媒体上发表自己的看法,通过对海量的用户评论数据进行情感分析研究,商家可以更好的得到产品的反馈从而辅助商业决策。然而传统的情感分析是对评论的整体情感极性进行预测,没有考虑评论中可能包含多个方面,不同方面具有不同的情感极性的情况,属于粗粒度的句子级情感分析。为了解决这一问题,细粒度情感分析任务被提出,其旨在推断句子中目标方面的情感极性,也被称作方面级情感分析。同时随着网络上用户发表评论时越来越流行使用多模态数据,因此有学者进一步提出了方面级多模态情感分析任务,其旨在利用图文数据推断目标方面的情感标签类别。本文主要对基于纯文本的方面级情感分析和基于图文的方面级多模态情感分析两种细粒度情感分析任务进行研究,并设计了细粒度情感分析系统使得用户可以在线对评论数据进行情感分析。首先,本文设计了一个基于深度学习的方面级情感分析模型—SE(Simple but Effective)模型。针对纯文本的用户评论数据,采用预训练语言模型获得文本序列和方面词的嵌入表示,然后通过结合双向长短时记忆网络和注意力机制,获得和方面词有关的上下文信息,从而执行情感极性预测任务。模型在五个数据集上进行了验证都取得了很好的效果。其次,在上一个模型的基础上增加了视觉模态的信息,提出了基于深度学习的方面级多模态情感分析模型—ABAFN(Aspect-Based Attention and Fusion Network)模型。针对视觉模态中的图片数据,采用预训练的残差网络提取图片特征,然后通过注意力机制获得基于方面的视觉表示。最后融合视觉表示和上下文表示来执行情感标签预测任务。通过在手机评论数据集上进行验证发现多模融合后的模型相比于单模态的性能要好。最后,基于上述提出的两个模型设计了细粒度情感分析系统,为用户提供一个在线情感分析平台。系统主要包括用户模块、方面级情感分类模块、方面级多模态情感分类模块、历史记录展示模块和用户共享记录展示模块五部分组成。
其他文献
随着工程技术在康复领域中的快速发展,辅助康复机器人备受关注。然而,手部动作精细复杂,既往康复治疗手段单一使得手功能障碍的恢复困难而缓慢。因此,如何提升康复机器人的性能,使得人机交互的沉浸感和真实感增强尤为重要。现有的康复机器人由于摩擦力、阻尼等外界干扰的存在,严重限制了系统性能的提升,从而使得力反馈、力控制性能下降,难以有效提高训练效果。基于上述内容,本文通过控制内回路和外回路的设计来抑制力/位混
学位
对区域土地利用碳排放进行测度有助于优化国土空间布局,为国土空间规划和区域碳补偿/减缓政策制定提供依据。该文基于1995-2018年京津冀区域土地利用和夜间灯光数据,利用碳排放系数和IPCC温室气体排放清单,探究区域土地利用碳排放时空分异特征。结果表明:1)京津冀区域净碳排放量呈现递增趋势,由1995年的12 461.78万t C·a-1增至2018年的35 706.69万t C·a-1,但增速减缓
期刊
随着计算机和互联网技术的发展,数字图像作为网络传输中的重要载体,网络传输过程中数字图像的安全性成为信息安全领域亟待解决的问题。可逆信息隐藏(Reversible Data Hiding,RDH)作为数字信息保护的重要方法,受到了信息安全研究者的广泛关注。本文以像素排序算法为基础,结合图像块分划处理方法与不同的预测嵌入方法,围绕嵌入容量与含密图像质量,提出两种完全可逆的信息隐藏算法,本文主要研究内容
学位
在以计算机技术和网络技术为先导的信息时代背景下,图像已成为社交体系中不可或缺的一部分,针对图像的安全高效传输和存储需求倍增,图像加密技术一定程度上解决了安全问题,以压缩率著称的JPEG图像解决了部分效率问题,因此针对JPEG图像的加密研究受到了研究者们的广泛关注。根据应用场景的不同,本文设计了两种JPEG图像加密算法,主要研究内容如下:设计了一种文件大小不变的JPEG图像加密算法。文件大小是JPE
学位
随着网络空间中数据的爆炸性增长,自动摘要生成技术应运而生,可以使得人们处理非结构化的文本数据,从而获得文本的大意。自动摘要生成技术的实现可以增强文档的可读性,减少搜寻信息的时间,获得更多适用于特定领域的信息,作为自然语言处理中热点问题,摘要生成技术具有重要研究意义。本文在现有理论基础之上,以探索摘要生成技术为目的,基于深度学习对自动摘要生成的关键技术进行相关研究,本文的主要工作分为以下三个方面进行
学位
物流行业中码垛机器人代替人工,能够连续高质量完成同一种货物在托盘上的码垛作业,从而不仅能减少人工劳动强度,降低成本投入,而且能提高码垛效率,提升企业整体生产效率。而混箱码垛是智慧物流发展趋势下机器人自动码垛尚需攻克的环节,以往依赖人工经验的码垛工作不足以应对混箱码垛的需求。大量碎片式订单的出现对机器人自动码垛在最优化、个性化等方面提出更高的要求。因此,如何规划合理的机器人混箱码垛的方案受到越来越多
学位
在“中国制造2025”和“互联网+”战略的指导下,信息技术与制造业融合创新发展,汽车行业累积了大量业务数据。伴随汽车产业链整车销售、售后服务等业务流程的执行进展,其关联业务数据可能发生变化,导致数据时效性难以判断,即无法确定当前数据否有效可用、其所在业务流程是否执行完成。然而,数据的时效低,将进一步导致数据的可靠度、准确性较低,从而影响业务数据分析挖掘的质量。为解决时效性问题,仅凭数据记录的时间属
学位
随着整车保有量的不断积累,前车市场利润空间缩小,汽车后市场却展露了其无限的潜力。作为汽车后市场重要组成部分的配件代理商在业务上只与其上下游企业合作,资源来源少,信息获取滞后。在库存管控方面,配件代理商采用单一的管理方式,导致配件库存积压常发生,造成代理商成本损失。因此,针对代理商需要提高市场响应速度、拓宽从外部获取资源的渠道、精准化库存管控的需求,本文基于第三方云平台对配件共享系统进行了研究,旨在
学位
随着汽车产业的快速发展,我国现有的汽车保有量也愈来愈多。不断扩大的汽车保有量为配件售后市场的繁荣发展带来了契机。然而配件业务的扩大发展给代理商的配件管理带来极大困扰,如代理商对来自不同产业链、不同编码的配件存储管理混乱,配件识别效率低下等问题。因此本文站在汽车产业链上的配件代理商角度,从代理商的配件供应与管理业务入手,开展配件可互换件关联匹配研究。首先,本文站在配件代理商的角度,讨论了课题的研究背
学位
该文以同步电动机用集电环套筒与轴过盈配合为例,介绍旋转部件热套紧量的选取方法,并通过有限元验证解析计算方法与有限元计算结果吻合的条件及相对误差。为旋转热套部件热套紧量选取、热套温度、摩擦系数选取、结构设计、热套工艺以及拆卸等提供理论依据。结果表明,采用该方法计算的热套紧量与仿真结果相对偏差小于15%。该方法可以应用于热套紧量计算。
期刊