基于深度学习的方面级情感分析方法研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:xiexiangjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,人们几乎每天都会在电商平台和社交软件中发表自己的观点、看法。通过情感分析技术能够自动从海量的等带有情感极性的评论文本中获取人们对事件、商品的情感倾向,这对于很多行业来说都有着巨大的价值。然而传统的粗粒度情感分析已经不能够满足人们的需求,人们往往希望获得对于某些事物或商品更加全面的了解。细粒度的方面级情感分析旨在分析不同方面所表达的不同情感,能够帮助人们更好的了解事物或商品的各个方面。在本文针对方面级情感分析任务进行了重点研究,提出两种深度学习模型,主要工作包括以下两点:(1)针对上下文和方面信息之间的交互信息和位置信息,提出了基于局部信息选择机制(Local Information Selection,LIS)的方面级情感分析模型。LIS首先根据上下文单词与方面词之间的位置关系计算语义相对距离(Semantic Relative Distance,SRD),利用两种处理方式和SRD阈值将句子分为两部分局部信息。然后设计规则选择出合适的局部信息与全局信息进行拼接。最后利用多头自注意力机制学习包含句子表征,输出隐藏状态并分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明LIS模型在三个数据集上分别达到87.24%、82.97%与75.58%的准确率。(2)针对LIS模型在获取局部信息时丢失句子原本的句法和语义的问题,以及对于学习句子表征的学习过于简单,提出了基于依赖树距离模型(Dependency-Tree Distance,DTD)。DTD模型使用句法依赖树结构重新定义语义相对距离(SRD),根据上下文单词与方面词在依赖树结构中的位置计算SRD,并据此截取局部信息。模型使用LSTM网络和多头(自)注意力机制学习句子表征,设计了交互式学习方式,能够更加深层次的提取句子信息,并将每一步的输出通过池化操作,在最后进行拼接作为最终的句子表达用于分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明DTD模型在三个数据集上分别达到87.91%、84.68%与75.81%的准确率。两种模型都分别采用了Glo Ve和BERT预训练词向量模型,并与三种Non-BERT模型和三种BERT-base模型进行对比实验,以验证模型的有效性。另外,设置了不同的SRD阈值进行对比实验,结果表明两种模型在Sem Eval2014和Twitter数据集上都有不同的SRD阈值以达到最优效果。
其他文献
癌症严重危害人类的生命健康,其中肺癌一直是癌症致死的首要原因。降低肺癌死亡率的有效方法是早期筛查。肺计算机辅助诊断(Computer Aided Diagnosis,CAD)系统可为医生提供客观的第三方意见,提高肺结节的检测效率和识别准确度。结节特征的选取与融合以及识别算法的改进对肺CAD系统性能的提升至关重要。 本文基于混合深度学习(Hybrid Deep Learning,HDL)模型主要围绕
学位
当前,高速列车已然成为城际间最重要的交通工具。牵引系统是高速列车的核心系统,是集机械、电气、通信等子系统为一体的多功能且高度集成的复杂系统,既为列车提供了充足动力,也保证了列车运行的可靠性。但随着高速列车运行里程的增加,牵引系统的元器件磨损,老化等问题日益突出,极易引发各种故障,若不及时处理,故障逐步加剧会给列车运行带来严重的安全隐患。因此,针对高速列车牵引系统开展故障检测研究具有着重要的意义。本
学位
近年来,任务型对话系统在工业界得到了广泛的使用,智能设备可以有效地搭载一个甚至多个对话平台。同时,元宇宙(Metaverse)作为虚拟现实的新型数字空间,无疑会增加人机对话的使用场景和使用频率。但是,人机对话领域仍然面对众多挑战,譬如模型优化方式、数据集不充分问题、对话响应准确率问题等等。在对话模型构建方式上,管道的方法需对各个模块的功能进行单独设计,实现起来比较复杂。随着对话数据量的增加,端到端
学位
为满足鸡蛋蛋白过敏人群对饼干的需求,以及崇尚健康饮食人群对低脂低油食品的偏好,在传统酥性饼干的配方基础上,以玉米油代替黄油、豆奶代替鸡蛋,制作一种新型饼干。通过单因素实验和正交试验,确定新型饼干的最优配方及工艺为低筋面粉100 g、玉米油30 g、豆奶35 g、巧克力豆30 g、赤砂糖25 g、幼砂糖15 g、小苏打粉1.0 g,以上火温度180℃、下火温度150℃烘烤25 min,制得的饼干香脆
期刊
目前,随着网络科技的日益蓬勃发展,大数据信息化时代也必将到来。尤其是文本信息的指数型增长,各种各样的新闻文本更是给人们的阅读带来了巨大的挑战。再加上越来越多的标题党新闻,因此,如何从海量的新闻中获取对读者有价值的信息越来越重要。文本自动摘要技术是一种可以从新闻文本集合中产生简洁而重要的信息的方法,已成为国内外的研究热点。根据组成句子中是否只存在原文中的短语或者词组,文本自动摘要技术可分为抽取式自动
学位
室外成像结果易于受到天气影响叠加不同程度的雾气,有雾图像往往呈现出对比度下降,图像模糊、饱和度差、泛白等现象,使得后续进一步的算法处理受到负面影响。本文主要研究与有雾图像相关的雾浓度评价、雾浓度自动感知以及图像去雾三方面内容。在雾浓度评估方法中本文改进了传统的无参考图像质量评价使其对有雾图像具有更加拟合人眼评价的评价效果。针对雾浓度自动感知方法,本文提出了基于目标检测置信度分布的特征提取方式以及局
学位
在复杂网络分析中链接预测是其重要的研究方向,其目的是根据已知网络信息,预测两个节点之间可能出现的链接。链接预测问题对于理解复杂网络的结构非常重要。作为复杂网络分析的有效手段,链接预测方法在社会网络研究、推荐系统、药物作用研究等领域均有重要的研究价值。在现实社会中,大部分的网络中链接不仅具有方向,往往还具有一些特定的属性,比如在投票网络中,投票的过程中会产生一些评论,这些评论可以理解为投票人对被投票
学位
无线传感器网络(Wireless sensor Networks,WSNs)由大量传感器节点组成,这些节点具有价格低、能量受限和微型化等特点,负责收集目标区域内的相关数据,并以单跳或多跳的方式将数据传输到汇聚节点(基站)。近年来,无线传感器网络已广泛应用于航空航天、工业、家庭、战场和许多其他领域。通常,它们部署在环境恶劣或无人值守区域,路由协议容易受到各种攻击。因此,安全的路由协议成为WSNs研究
学位
随着科技飞速进步,电力电子技术被广泛应用于各种前沿科技领域,并渗透到了工业生产、电力系统等方方面面。在电力系统向新能源转型的过程中,直流输电线路越来越多,电网的电压等级也不断提高,高压电力电子集成技术随之快速发展,为了满足电力电子装置的功率范围、电压应力等性能要求,电力电子系统集成化、标准化、模块化技术仍然需要深入研究。其中,多变换器模块输入串联输出并联(Input Series Output P
学位
光纤布拉格光栅(Fiber Bragg Grating,FBG)由于其自身本质无源、耐腐蚀、抗电磁干扰、测量速度快、传输距离远等优点,使其可以安装在各种复杂恶劣的环境中,为电力工程、深隧工程、交通隧道、能源勘探等领域进行结构健康监测、火灾报警、周界安防等应用的应变、温度、振动等参量进行实时在线监测。本文围绕深隧工程中隧道损伤情况进行长期健康监测的问题,在研究弱光纤光栅传感机理、混合复用及波长特征识
学位