基于Attention与BiLSTM模型的多情感分类方法研究

来源 :南华大学 | 被引量 : 1次 | 上传用户:fanrend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以往的情感分类大多是基于粗粒度进行的,针对五分类进行的研究不多,且最终的情感分类结果只包含一种情感,很少对多情感共存现象进行研究,因此不能完全体现用户情感的丰富性。研究学者使用Attention机制对单语或双语文本的研究技术也取得了不错的成效,但鲜有针对语码转换文本(Code-Switching Text)的情感分类进行研究。针对这些不足,本文提出一种基于Attention与BiLSTM模型的多情感分类方法,通过BiLSTM模型构建五个情感分类器来获取文本上下文关系,分别是Happiness、Anger、Sadness、Fear、Surprise情感分类器,从而预测出单个帖子所属的所有情感。使用word2vec的Skip-gram方法将语码转换文本转化成词向量来作为多情感分类器的输入,并采用负采样方法提高词向量的质量、加快训练速度,针对不同词对文本的权重不同引入Attention机制来表示不同特征的重要性,增强上下文语义信息,并获取更深层次特征,最后通过Softmax进行回归,完成所有帖子所属的所有情感预测。通过对基于Attention与BiLSTM模型的实验结果进行分析,发现Surprise和Fear情感分类器的性能明显低于Happiness、Anger、Sadness情感分类器,分析原因为语码转换文本存在类别不平衡问题,由于数据量小的类别在训练模型时特征不明显,导致将数据量小的类别预测为数据量多的类别,降低了情感分类准确率。为了解决上述问题,本文提出一种改进的基于Attention与BiLSTM模型的多情感分类方法研究。使用新浪提供的API抓取微博中的语码转换文本数据,邀请20名自然语言处理领域的同学对抓取的数据类别进行标注,从中有目标的选取五种类别的数据,比如选取同一个帖子包含多种情感的数据,每个类别数据量统一为2000条,使得语码转换文本达到类别平衡从而对语码转换文本进行扩充。使用伪梯度下降法调整模型参数,对交叉熵损失函数进行优化,降低复杂度,使得模型的分类性能更稳定。实验证明,改进的基于Attention与BiLSTM模型的多情感分类方法研究与未改进的算法相比,缓解了少数类被错分成多数类的问题,Marco-F1值提高了11.4%,且每个情感分类器的F1值均有很大的提高,减小了Surprise、Fear情感分类器的F1值与其它三个情感分类器F1值的差距,因此改进的基于Attention与BiLSTM模型的多情感分类方法研究可以更为准确的判别文本的多种情感,取得了更好地分类效果,验证了模型的有效性。
其他文献
随着国际贸易规模的扩大,海上交通运输量快速增长,在交通流较大及态势复杂的海域,易发生水上交通事故,造成人员伤亡和经济损失。基于船舶交通服务系统提供的AIS数据,提高船舶
现如今,随着我国北方大部分地区都产生了一定程度的雾霾天气,环境污染问题的治理迫在眉睫。火电厂氮氧化物的排放是造成这种污染的重要来源之一,当前氮氧化物脱除技术中选择
井壁失稳问题是钻井施工过程中一个极其复杂的问题。它会给钻井工程造成巨大的困难,不但延长了钻井周期,同时还会大大提高钻井成本。为了解决井壁失稳问题,为此需要科学钻井,
视频不仅是人类生活的重要组成部分,而且在各个领域的应用都占有关键性地位。面对视频压缩效率的亟需,下一代视频编码标准VVC、AVS3已经诞生并取得了良好的压缩效益。另一方
近年来,深度学习技术在多个领域取得十分优异的成就,如计算机视觉、自然语言处理和语音处理等,越来越多的相关应用出现,这给人们的生活带来了很多便利。然而,深度学习在表现
青光眼是由多种因素引起的以进行性视功能损害为主要特征的眼部疾病,目前临床上主要采取局部滴眼液治疗青光眼,患者对这种给药方式接受度高。但是滴眼液每天使用的次数较多,
近年来,随着技术的飞速发展,出现了许多新技术和新方法,血氧水平依赖功能磁共振成像(blood oxygen level dependent-functional magnetic resonance imaging,BOLD-fMRI)是一
随着移动通信和宽带无线接入技术的快速发展以及用户本身日益增长的业务需求,未来通信网络异构融合已成为必然的发展趋势。网络选择作为异构无线网络资源管理的重要方面,旨在
啤酒泡沫蛋白主要来自于麦芽,其数量与各分子量区间蛋白组分的比例影响啤酒泡沫的质量。本论文研究了麦芽库值、蛋白质含量、蛋白酶等与麦汁高分子蛋白质含量的关系,建立了麦
随着全球制造业的快速发展,各行各业对产品的多样化、个性化的要求越来越高,柔性化生产模式在制造领域被广泛采用,并逐渐成为未来的发展趋势。自动导引运输车(automated guid