基于深度学习的情感分析方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:n62315942
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的用于解决文本情感分析问题的方法包括基于情感词典和人工判定规则的无监督方法、基于机器学习的有监督方法。在数据量不大或者语义不够丰富的时候,这些方法能够取得一定的效果。但是随着数据量越来越大、表达方式越来越丰富,传统的方法已经无法有效地解决这一类问题,新的方法亟待提出。本文根据文本情感分析的特点,结合当下应用领域广泛的深度学习算法,重点研究了基于深度学习的情感分析方法。卷积神经网络和递归神经网络是深度学习中两个主流的模型,前者能够从数据中提取出局部特征,而后者能够有效地分析时序数据、具有很强的上下文概括能力。本文的工作包括以下两个方面:1、基于卷积神经网络和词语邻近特征的情感分析模型。目前,基于卷积神经网络的方法在情感分析任务中已经取得了不错的效果,此类方法使用词向量作为网络的输入,但是在卷积过程中每个词向量只能表征单个单词,并不蕴含上下文信息,这不利于信息传递的连续性,并且卷积操作在局部范围内可能会打乱词向量的序列性。针对这个问题,本文提出一种基于词语邻近特征的卷积神经网络模型,在卷积过程中让每个词向量携带邻近词语的特征,这样既保证信息传递的连续性也保证了词向量在局部范围内的序列性。实验结果表明,在COAE2014、COAE2015的情感分析任务上的准确率分别达到了 89.43%和85.61%,说明本文提出的方法确实可行、有效。2、基于递归神经网络和人工判定规则的情感分析模型。传统的基于情感词典和人工判定规则的分析方法是从语言学的角度出发,但是这种方法需要制定大量的情感词典和判定规则。而基于递归神经网络的分析方法可以通过不断的编码和重构训练,从大量未标注的语料中学习到先验知识。本文在参考了这两种方法之后,在第4章中提出了一种新颖的基于递归神经网络和人工判定规则的情感分析模型。首先利用递归神经网络并行计算出组成文本的多个子句的情感极性,然后根据极性融合规则将多个子句的情感极性进行融合,最后利用人工判定规则计算出原始文本的情感极性。该模型的优点在于:一方面递归神经网络中融入了人工判定规则,使得以往积累的人工经验得到有效利用;另一方面递归神经网络取代了情感词典,避免了情感词典的局限性。该模型在数据集SST-C2和SST-C3上的分类准确率分别达到了 87.8%、81.6%,并且整体性能均优于主流的分类模型,说明该模型不仅新颖,而且确实可行、有效。
其他文献
汽车在加减速行驶过程中的异响直接影响驾乘的舒适度,一般城市型SUV(Sport Utility Vehicle)在行驶过程中的啸叫噪声主要由后桥引起,通过对某城市型SUV汽车后桥进行台架NVH(Nois
创新日益成为企业持续健康发展和获得核心竞争力的重要来源,研发一直是创新活动的核心,而研发活动需要大量的现金作支撑。两权分离导致代理问题层出不穷,使得掌握企业现金的
在我国经济增长,新型工业化、城镇化持续推进的时代背景下,促进了各个行业的发展,未来几十年这些行业对于作为物质基础的矿产资源的需求量也会逐渐增加。传统的矿产勘查模式
1 产生H2O2菌斑微生物1923年,Mclead和Gorden首先报道肺炎链球菌能产生H2O2,后来学者们又相继发现β溶血性链球菌和乳杆菌也能产生H2O2[1].尽管口腔菌斑细菌种类多,数量大,但
任何大型设备在工作一定的期限之后必然会出现磨损现象,矿山机械设备也不例外。这就需要施工单位和相关的工作人员定期对矿山机械设备进行科学地管理和更新改造。但是就目前来
【目的】探明褐飞虱Nilaparvata lugens成虫肠道微生物群落结构和多样性。【方法】分离褐飞虱成虫完整肠道并提取总DNA,利用Illumina MiSeq(PE300)技术对其肠道细菌16S rRNA
中医阴阳理论可以囊括万物,包括中医诊病中的重要元素“正”和“邪”。阴阳的统一关系同样也反映于“正”和“邪”关系中,这种关系主要包括和体现在:正邪互根,正邪相互转化,正
目的:制备5-氨基水杨酸结肠定位缓释微丸胶囊,建立其体外药物释放度分析方法,并研究其体外释放行为。方法:以挤出滚圆法制备微丸丸芯,采用Mini-glatt流化床进行包衣,研究了不
以煤矸石替代部分碎石、粉煤灰和矿渣替代部分水泥配制煤矸石混凝土,采用正交试验对其进行了耐久性的研究,分析了经硫酸盐侵蚀后抗压强度损失值、渗透系数及其冻融后弹性模量损
天基信息分发系统是通过卫星将星上获取的信息数据广播给地面终端。基于S频段的信息分发系统具有低功耗、小型化、安全性等特点,通过接收星上数据信息,进行筛选、复接、AOS格