基于深度语义特征的情感分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:easyJMS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年深度学习方法在自然语言处理领域越来越受到关注,深度学习通过特征组合使其能够表示句子的深层语义特征。本文基于深度学习的神经网络模型,研究情感分类的领域自适应、评价对象抽取与评价对象的情感倾向性判定这三个方面的情感分析中的关键问题,这些问题的研究方法不仅可以用在情感分析任务中,还能应用到许多其他的自然语言处理任务中,因此该论文的研究具有重要的理论价值和研究意义。在情感分类的领域自适应研究中,针对大量有标注语料不易获取的问题,本文提出使用有标注语料与无标注语料联合训练词向量,并采用主动学习与自学习相结合的策略进行领域迁移的方法。实验结果表明在训练语料较少的情况下,联合训练能够明显提高词向量的泛化能力。同时词向量储存了用于情感分析的大部分知识,当从一个领域向另一个领域迁移时,词向量只需做少量的调整,因此在领域迁移过程中只需少量迭代就能使目标领域的分类器达到良好的性能。使用主动学习策略可以缓解单纯依赖自学习来扩展语料所出现的自误导现象,实验结果表明,加入主动学习后,分类器在迭代后期的性能下降现象得到了缓解,而且其性能还略优于基于有监督的训练方法。在评价对象的抽取研究中,针对统计学习方法中特征需要人为设定并且还受到上下文窗口大小的限制,导致抽取结果的召回率较低的问题,本文提出了基于双向循环神经网络(BRNN)来抽取评价对象的方法。双向循环神经网络通过引入正向隐藏层和反向隐藏层,使之能分别储存上文与下文的信息,并且不受窗口大小的限制。本文还添加了词性、依存句法树关系等特征,并与条件随机场模型进行了比较,实验结果表明语言学特征能够提高抽取性能,而且BRNN在召回率方面优于CRF。该方法在2015年全国中文倾向性评测(COAE2015)的受限资源测试上取得第一名。在评价对象的情感判定研究中,针对已有方法对评价对象情感判定没有充分利用上下文信息的问题,本文提出联合长短期记忆模型(LSTM)与卷积神经网络模型(CNN)判定评价对象情感的方法。首先判断评价对象所在分句的情感倾向,然后根据分句的情感预测评价对象的情感,其中LSTM用来生成上下文向量,CNN用于从词向量序列中抽取特征。该联合模型能够充分利用上下文信息,同时能一并解决否定词、网络新词等对评价对象情感判定的产生影响的各种问题。实验结果表明该方法对分句进行情感判定是有效的,通过分句的情感极性预测评价对象的情感极性,其实验结果明显优于常用的基于情感词判定的方法。
其他文献
软件测试在软件的整个开发过程中占有非常重要的地位,是保证软件质量、提高软件可靠性的关键步骤之一。测试自动化是软件测试的一个发展趋势,人们在自动化软件测试方面做了大
研究和开发苹果自动实时分级系统,选出高质量的水果,为国家创取外汇,在我国具有重要的经济价值和广阔的应用前景,目前国内外研究比较多的是农产品苹果的品质检测。在苹果品质
深空探测是人类探索外太空,认知宇宙,近距离观测天体的重要途径。深空探测器从发射到逐渐接近目标,实现对目标天体的交会飞掠、撞击或着陆探测,需要完成远距离、长时间的航天
基于B/S结构的Web应用系统渐渐成为Internet上使用最为广泛的应用开发技术。框架技术是J2EE中重要的软件技术,框架技术能够提高软件的开发效率,同时让各个应用层以松散耦合的
IT行业的快速发展,带动了所有传统行业的发展,包括海运物流。传统的海运物流模式具有信息不对称性,即海运物流需求者与海运物流服务提供者之间存在较大的信息差,双方的沟通的
图像信号在产生、传输过程中,经常会受到各种噪声的干扰,一般来说,现实中的图像通常都是带有噪声的。因此图像处理工作中,在进行图像分割、模式识别等高层次的处理前,选用适
人脸识别是一项方兴未艾的生物特征识别技术,广泛应用于各行各业身份识别的信息技术领域。近十年来,伴随着网络通信和多媒体技术的飞速发展,以及计算机硬件水平的快速提升,作
学位
在社会主义民主政治以及和谐社会发展的过程中,论坛BBS已成为人们交流意见和发表评论的重要平台。为了及时采集BBS舆论信息,掌握BBS热点话题评论内容的观点、态度和情感倾向,监
自然语言处理最根本的目的就是让计算机能正确处理人类语言,利用计算机对词语语义进行理解是自然语言处理中最为关键的问题。词义相似度计算作为语义理解的基础性工作已被广