基于深度学习的方面情感分析研究

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:spiderkiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是自然语言处理领域中的一个重要研究方向,在产品调研、网络舆情发现和社会热点分析等诸多领域有着广泛的应用价值。基于方面的情感分析是细粒度的情感分析任务,通过对文本描述的方面进行细粒度化的分析归纳来获取深层次的情感特征。近年来深度学习模型在自然语言处理领域表现出了独特的优势,能够处理海量文本数据并自动化捕捉深层次的语义特征,被广泛应用于各类下游任务中。在情感分析领域,通过搭建合适的深度学习模型挖掘文本的更深层次的信息已经成为了提升分析效果的重要途径。本文在深度学习模型的基础上,针对基于方面的情感分析的子任务:方面识别任务和方面情感分析任务,分别提出了高效的深度学习模型。首先,通过对标注语料的分析研究发现文本中存在对方面的识别具有很强导向性的关键性单词,但现阶段的模型由于较小的数据集规模和数据的稀疏难以充分学习到关键单词与方面间的对应关系。基于此,本文提出了基于对齐特征和Bi LSTM的方面识别模型。模型先使用具有双向网络结构的Bi LSTM捕捉文本的双向语义信息,同时根据文本关键单词对方面识别导向性的特点进行数据重写,与原文本构成双语平行语料,再引入机器翻译中的对齐算法将平行语料作为输入,提取单词-方面间的双向对齐概率作为对齐特征,最后在Bi LSTM隐藏层最后一个隐状态处与对齐特征拼接后进行方面识别。实验结果表明,本文提出的模型在不同数据集上的表现超过了基线模型,改进之处能够有效提升方面识别任务的效果。其次,针对方面情感分析任务中文本包含多个方面信息的场景,现有研究大多依赖LSTM捕捉时序特征的能力对方面间关联性建模,但方面和情感信息在文本中出现的次数和位置具有偶然性,多个方面间通常会相互影响,且方面间不具有规律的时序特征,导致单LSTM并不适用于方面情感分析任务。基于此,本文提出一种融合多方面注意力机制的方面情感分析模型。该模型结合预训练语言模型BERT和Bi LSTM搭建了BERT-Bi LSTM文本编码模块,在编码层构建了多个平行的编码模块将目标方面与邻近方面下的文本同时编码,利用注意力机制对方面间的关联性建模,以目标方面下的文本表示为集成中心,使用注意力权重作为方面权重融合所有邻近方面的信息,生成具有多方面感知能力的情感分类特征向量进行预测。实验结果表明,本文提出的模型在不同数据集中的表现超过了所有的基线模型,改进之处能够有效提升方面情感分析的效果。
其他文献
学位
人防工程作为城市中重要的防护结构,对于提升城市保障能力具有重要意义。人防工程主要为地下工程,除了承受土压力等静荷载作用外,主要用于抵抗战时受到的冲击、爆炸等动态荷载。目前,修建人防工程的主要材料为混凝土,具有抗压性能优越、抗拉性能差、易开裂等特点,在一定程度上影响了人防工程的整体抗力。纤维增强混凝土(Fiber Reinforced Concrete,简称FRC)作为近年来新出现的一种材料,纤维依
随着工业机器人应用的普及,工业生产的自动化水平不断提高,基于机器视觉的自动化装配、分拣在自动化工业生产中具有重要的应用前景。相较于传统的人工装配,基于工业机器人的自动化装配在高效性与稳定性等方面都具有显著的优势。对工业场景下的零件进行识别及姿态估计,在提高机器人装配、分拣等生产环节的自动化程度具有重要的意义。针对工业环境中零件识别效率低,姿态估计准确率不高以及大量训练集难以获取的问题,对基于深度学
随着工业生产智能化的发展,工业机器人想要通过机器视觉自动识别、定位无序物体、并完成拾取的操作,就必须准确的估计目标对象的六维姿态。因此、三维物体的六维位姿估计成为了目前急需解决的难题之一。对于工业生产中的三维目标来说,材质多为金属或塑料制品,表面纹理稀少、难以提取稳定的特征描述子,位姿变化范围大、图像和位姿搜索空间大、搜索过程需花费大量时间,同时受外部环境影响较大,易出现误检测、定位不准等现象。为
本文基于莱西市2017年1月-2020年2月大气颗粒物PM2.5和PM10监测数据、其他气态污染物(SO2、NO2、CO、O3)的逐时浓度数据,结合气象数据(温度、气压、相对湿度、风速)和GDAS再分析气象数据等,综合运用数理统计的方法,分析了 PM2.5和PM10污染的时间变化规律(年、季、月、日、疫情停工期间),运用Kriging空间插值法分析了 PM2.5和PM10在2019年及四季的空间分
随着我国经济的高速发展和人们生活质量的不断提高,居民对居住区景观品质的追求不断提升,但目前居住区景观发展速度缓慢,无法满足居民对于景观品质的要求,导致两者之间矛盾逐步显现。所以,在宜居城市建设和居民对居住环境需求转变的背景下,居住区作为城市公共空间环境的重要组成部分和承担居民日常休憩生活的重要载体,其景观的宜居性建设既是时代发展的要求,又是社会进步的产物。本文通过文献整理、专家咨询、居民走访调查、
在数字化改革的进程中,智慧社区的建设已经全面展开。传统社区的智慧化改造作为智慧社区建设的重要组成部分,受到各级政府的广泛关注,全国各省市正在结合区域发展特色积极推动传统社区智慧化改造的试点建设工作。目前我国在智能技术的应用与社区的智慧化管理方面取得了一定成就,但从用户需求的角度出发探讨如何利用智慧化手段提升空间环境方面关注相对较少。因此,对于如何进一步提升传统社区的空间品质显得尤为迫切。本研究以用
随着我国工程建设的快速发展,不可避免要对山区边坡进行人工切坡开挖,而因切坡过程不当所诱发的滑坡现象经常发生。堆积层边坡作为最常见的边坡类型之一,其坡体物质组成松散,对该类边坡进行切坡开挖施工则更容易诱发滑坡。因此,如何依据堆积层边坡的切坡致滑灾变规律,建立与其相适应的有效稳定性评价模型,已经成为滑坡稳定性评价领域内亟待研究和解决的重大课题之一。本文依据堆积层边坡的特点以及切坡失稳致滑效应,以四川省
水是地球万物生命之源,是生物圈的血液,是人类赖以生存和发展的物质基础。受到世界人口的大幅增长、社会经济的快速发展、水资源不合理的开发与利用及工农业污染物的超标排放等因素影响,水质恶化现象日益严重,突发水环境污染事故频发。在此背景下,水质安全预警体系研究逐渐成为各国环境管理部门及科研学者关注的热点。现有的水质安全预警体系只能对渐变式水环境污染事故或已经发生并有恶化表象显现出来的突发式水环境污染事故进
基于带隙工程的可调激子动力学在光伏以及信息存储等领域收到了广泛关注与研究。以二硫化钼为代表的二维过渡金属硫族化合物(TMDCs)带隙覆盖1.5~2.4e V,具有丰富的激子物理特性,因此广泛应用于各类光电子器件中。通过化学掺杂,施加预应力等方式可以对材料的带隙进行一定程度的调控,从而优化其激子器件性能,但是这些方法普遍操作复杂、难以定量操控,导致材料中激子的动力学过程波动较大,器件性能难以稳定,限