基于递归神经网络的微博情感分类研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:WRYJL2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为近年来快速发展的社交网络平台,微博由于易操作,传播快,灵活度高等特点,已得到用户的普遍推崇和使用。虽然用户发布的微博内容很繁杂,但通过对其观察和分析发现,其中潜藏着大量的有用信息,尤其是微博文本中包含的情感倾向,有助于政府和企业了解大众需求、引导舆论、发现商机、提高收益。目前,针对微博文本的情感分类研究越来越受到相关领域学者的关注。如何学习深层语义、有效表示文本特征、提高情感分类效果一直是相关领域要研究的目标。本文主要研究了微博文本情感分类的两大方面:微博文本主客观分类和微博文本情感极性分类。在主客观分类阶段,提出了基于词典和语料相结合的方法。在情感极性分类阶段,对微博文本的特征提取方法和分类算法分别进行了研究。其中,针对特征提取,提出了基于浅层和深层学习的特征融合方法;针对分类算法,提出一种基于改进的递归神经网络的情感分类方法。本文的主要工作和创新成果具体如下:(1)针对微博文本的主客观分类问题,提出了基于词典和语料相结合的方法。首先根据本文所构建的可靠情感词典对可靠度较高的主观性文本进行识别,然后结合语料统计的方法对剩余文本进行主客观分类,最终得到的F1值比传统的基于大规模情感词典的主客观分类方法要高出6.72%。(2)鉴于一般的浅层学习特征忽略了文本内在语义,提出一种基于浅层和深层学习的特征融合方法。其中浅层学习特征选取了词、词性和词典这三类特征,深层学习特征利用word2vec工具进行提取,然后对它们进行融合。实验结果表明,特征融合后的微博文本情感极性分类效果要优于仅采用其中任何一种特征的效果。(3)针对微博文本的情感极性分类问题,采用一种改进的递归神经网络模型。该模型将一般递归神经网络的隐藏层替换成LSTM结构,使得在情感分类过程中,不仅把文本序列前后的相关性考虑在内,而且能够学习到文本中距离较远的相关信息。实验最终得到85.04%的分类准确率,比传统的采用基于浅层学习特征的支持向量机方法提高了3.17%。
其他文献
信息爆照时代,数据规模急剧增加,大数据分析计算平台应运而生。以遗传算法为代表的智能算法,具有并行运行的特点,在处理多条件、多约束及非线性等实际问题中所起的作用越来越
子宫解剖因素多指子宫内膜息肉、宫腔黏连、黏膜下肌瘤、腺疾病等,加深子宫解剖因素对生殖预后影响的研究,对于提高不明原因复发性流产、不孕等疾病的宫腔镜治疗效果具有重要
三国时期的曹操以善于用人而著称,他于东汉末年反董卓之乱中起兵,在他的地位、政权没有巩固之时,曾提出“唯才是举”的政策,对其扫荡群雄统一北方确实起到一定的作用,得到大
目的妇科急腹症的阴式超声临床诊断价值予以探讨。方法选取2016年3月~2017年5月我院收治的妇科急腹症患者79例,给予其阴式超声诊断及病理检查,对比分析阴式超声诊断符合率。
以微博为代表的社会媒体的飞速发展为情感分析方向带来巨大的资源,同时也对情感分析算法的性能提出了更大的挑战。其中,现有的情感词典尤其是中文情感词典规模不足是影响情感
【正】 《袁中郎集》载有这位明代公安派诗人给当时著名书画家董其昌的一封信:《金瓶梅》由何处得来?伏枕略观,云霞满纸,胜于枚生《七发》多矣.后段在何处?抄竟当于何处倒换?
从我国面临的养老形势和养老意愿为出发点,通过分析慈善信托这种慈善组织的特点和运作机制,提出建立慈善信托委托人积分制、具体养老服务委托制、慈善信托养老监督体系完备制
化学实验方案的设计一直是高三化学复习教学和高考难点、热点之一,对学生的思维能力要求高。教学中针对学生的学情和认知难点,引领学生进行模型认知,帮助学生树立模型意识,应
新建隧道邻近既有高铁隧道进行爆破施工时,炸药爆炸产生的爆破振动波可能会引起既有高铁隧道衬砌结构和周围围岩的破坏,对既有高铁隧道的安全运营造成影响。因此,为了保证既