基于BERT模型特征构造的社交网络文本情感识别研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:chunhuaqiuyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展以及新媒体形式的社交平台等的兴起,不计其数的用户参与到了网络社交平台的使用中。社交网络的文本作为带有强烈情感色彩的文本信息,对研究用户的兴趣取向具有重要的帮助。如何对这些文本信息的情感色彩进行准确的识别分析已经成为了当前学界众多科研人员的主要研究问题。近年来,以无监督方式经过长时间的训练之后得到的BERT模型,在NLP领域有着显著的成果。本文在BERT模型的基础上,提出了一种名为B-Feature的特征构造的方法,结合改进之后的LSTM模型,对社交网络的文本信息进行情感识别分析。本文的主要内容如下:(1)分词作为传统方法获取文本向量的主要步骤,具有一定的局限性。本文提出一种基于BERT模型的特征构造的方法B-Feature,在避免分词的基础上,保留了文本语句的主要特征信息。通过对句编码的信息,进行补充,重组以及删减之后,在获取的句编码的基础上对文本的特征向量进行构造,得到处理过后基于BERT模型构造的特征。通过对比实验表明,提出的特征构造的算法,与TF-IDF等方法相比,在搭配相同的神经网络分类器的情况下,在长中短三种长度的公开数据集上的准确率分别提高了7.8%,3.8%,11.7%。(2)针对传统方法对社交网络文本情感识别准确率不高的问题,本文选取LSTM作为实验基础模型,在单向LSTM的基础上,加上一条反向的LSTM,并在此基础上引入注意力机制使其能够更好的关注特征中的关键特征,之后将特征构造的方法B-Feature与引入注意力机制的双向LSTM组合搭建模型,将特征构造后的特征信息送入引入注意力机制的双向LSTM中训练并进行分类。实验证明,本文提出的模型与传统的方法结合LSTM的模型相比,在两个公开的微博文本数据集上的准确率分别提升2.96%与3.87%。(3)在本文提出的算法及模型组合的基础上,设计并实现了社交网络热点话题分析系统。该系统通过爬虫获取社交平台上的热门话题及话题评论,通过本文的模型对获取的文本信息进行情感识别,使社交网络文本的情感色彩以可视化的界面的直观的呈现给用户。不仅功能全面,而且提高了用户获取信息的效率,实现了本文的应用价值。
其他文献
酒精是一种重要的有机溶剂和化工原料,在国民经济中占有重要的地位,广泛的应用在食品、化工、医疗、电子、化妆品和染料的生产等各个行业。糖蜜作为酒精生产的一种原料,是糖
近年来,环境事故的频发引起了全社会的关注与反思,如何对环境进行保护的话题引起了社会各界的广泛讨论。企业作为产生污染的最主要源头,理应承担相应的环保责任,为了对企业的
方力钧,"光头泼皮",带有顽世色彩的绘画作品,曾与崔健的音乐、王朔的小说一道成为时代的标志。1989年他第一次展示了自己的"光头"形象,随之"光头"成为当代绘画的前卫符号。目前,"光
序 言正如特吕弗、戈达尔、夏布罗尔和里维特一样,埃里克·罗麦尔的名字也是跟法国“新浪潮”紧密相连的。这场运动不仅改变了法国电影的面貌与走向,而且对世界电影产生了深
本文以普通硅酸盐水泥、轻质多孔膨胀珍珠岩为主要原料,研究了制备工艺、膨胀珍珠岩掺量、发泡剂种类和掺量、材料厚度、水灰比及养护温度等对材料吸声性能的影响。研究结果
“民以食为天,食以安为先”.生猪肉是如何检查?如何保障安全?检疫检验如何把关?私宰肉、问题肉如何举报?对于以上这些问题,我们将通过“畜禽屠宰与肉品安全知识200问”,对畜禽屠
为减少食管癌及贲门癌术后吻合口漏、狭窄及反流性食管炎的发生, 我科1998年以来采用食管黏膜插入胃浆肌层瓣包套吻合术治疗食管癌患者109例, 贲门癌患者11例, 并与食管癌常
在实施新课程中,数学教学过程是实现课程目标的重要途径,它突出对学生创新意识和实践能力的培养,教师是数学教学过程的组织者和引导者。新课程要求教师在设计教学目标、选择
剧情介绍  刘易斯是一个有着发明天才的孤儿,有过很多巧妙的发明。他最新也是最野心勃勃的发明是记忆扫描仪,他想通过这台机器找到自己的生母并与她团聚。