基于Attention机制的短文本情感分类方法研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:shaoping6868
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网技术的迅猛发展,大量高效便利的社交化产品逐渐融入社会,多数行业与互联网联系愈加紧密,互联网发展日渐多元化。不同于论坛、博客等传统工具,新兴社交工具具有即时性,传播速度惊人、范围广泛,影响及改变着人们的情感判断,因此对其进行情感分析可以及时了解舆论风向,得到有用的决策信息,能对商品销售、舆论监控等提供重要支持。新兴社交工具传播的信息简短精炼,属于典型的短文本结构,口语化程度高,表述不规范,语义特征缺失,准确判断短文本的情感倾向具有挑战性。本文借助Attention机制及深度学习模型,高效的挖掘短文本的语义特征,对短文本进行情感极性分类,对评价对象进行情感倾向性识别,同时实现评价对象高效准确的提取。本文的主要研究工作包括如下几部分:(1)短文本情感极性分类。该部分结合卷积神经网络(CNN)及长短时记忆神经网络(LSTM)进行短文本情感极性判断。同时引入Self-Attention机制与Capsule网络进行深层语义的学习及特征的提取,最后基于多层次网络结构进行情感极性分类方法研究,进一步优化模型性能。(2)评价对象情感倾向性判断。该部分从文本自身及交互式信息两个角度,对文本中不同评价对象进行情感分析。首先,设计位置权重编码特征,突出更加贴近评价对象的情感特征,结合多重Attention机制实现评价对象情感倾向性判断。同时,针对交互式特征的学习,利用Scaled Dot-Product Attention,构建层次化Attention模型,更好的融合评价对象与文本上下文的交互信息,达到更优的情感分类性能。(3)基于Bert模型的评价对象抽取。本文引入Bert模型,通过深层次的学习,有效的提高了数据预处理及预训练的质量。结合双向长短时记忆神经网络(BLSTM)及条件随机场(CRF),进一步提高评价对象抽取的质量。本文基于Attention机制对短文本情感分析算法进行研究及优化,实现了短文本情感极性分类及评价对象情感识别,有效的缓解短文本信息简短精炼、特征缺失等问题,提升了情感分析模型性能。同时结合Bert模型,实现了评价对象的高效提取。
其他文献
二、职业技能鉴定制度的发展方向与主要对策 (一)总体目标 实施职业技能鉴定制度是劳动力资源开发利用与管理领域里的一项重要基础工作,必须适应社会和经济的发展。总的目标
作为一个共产党员,应该走在时代的前列,在全面建设小康社会的历史进程中,如何发挥排头兵作用、模范作用是摆在我们面前的一项重要任务。 第一,提高政治素质,增强使命感。当前
兰州交通大学研究丝路文化、敦煌文化、研究交通的条件得天独厚,在这样的条件和背景下思考,研究建立一个的"大敦煌"、"大交通"现代艺术设计教学体系,有着重要的现实意义。
灭火器是扑救初期火灾常用的消防器材,保证其合理配置、及时检查维护以及正确使用,是保证灭火器其效能的关键。文章针对具体实际情况,先对建筑灭火器配置的问题进行了分析,主
目的探讨累积残差在广义估计方程模型诊断中的应用及SAS9.1.3软件实现。方法收集癫痫新疗法临床疗效资料,构建广义估计方程模型,根据QIC准则进行作业相关矩阵选择,采用累积残差检
建立动物模型是医学研究的重要手段,而中医对于疾病的发病、诊断、治疗等一直多以人为观察对象。本文旨在总结中医证候动物模型的研究进展,为继续进行中医证候实验研究提供思
针对齿轮轴的结构特点,运用有限元方法建立了齿轮轴的有限元模型,并进行了模态分析,给出了齿轮轴的前10阶的固有频率和振型,对其频率和位移响应态进行了分析,指出了最大位移
从最基本的概念、范畴入手,考察马克思主义范畴体系的构建及其发展,在认识论上具有重要意义。邓小平理论是与马克思列宁主义、毛泽东思想一脉相承的统一的科学体系,邓小平理
以南京发布的政务微博为样本,建立一个专门的数据库,分析其网络组织结构特点,探讨集群对政务微博信息扩散与影响力的作用。研究旨在丰富政府微博扩散理论,帮助政务微博建立模
并列罪名与选择罪名的刑法意义迥然不同。包庇黑社会性质组织罪与纵容黑社会性质组织罪在犯罪构成上的显著差异从根本上决定了这两个犯罪不可能是选择罪名关系;实践中,无论是