论文部分内容阅读
文本情感分类已经在情感分析的研究中占据相当重要的地位,它主要通过自然语言处理,文本挖掘以及计算机语言学等方法来识别和提取文本中的主观信息。伴随着信息的爆发式增长,很多研究者将深度学习的理论运用于文本情感分类,并且在句子及文档的情感分类中取得了不错的效果。卷积神经网络能够捕获空间结构上的局部关系,可以出色的提取到句子中各部分的局部特征,但缺乏学习连续句子间相关性的能力。迭代神经网络能够处理连续性的信息,使其在句子或文档的建模中取得了很好的效果,但在并行的提取文本特征方面则效果不佳。针对这些问题,该研究构建了一种新的结合卷积神经网络和迭代神经网络各自优势的深度学习模型——C-LSTM(Convolutional-Long Short-Term Memory),用于句子的表示和文本情感的分类。具体的工作如下:1、对当前主流的用于文本情感分类的深度学习模型进行了研究,构建了基于卷积神经网络(Convolutional Neural Network,CNN)和基于LSTM(Long Short-Term Memory)的中文文本情感分类模型用于研究。2、在此基础上,构建了基于C-LSTM的中文文本情感分类模型,用于文本情感分类的研究,该模型利用卷积神经网络提取句子中高级别的词语表示,将获得的结果输入LSTM得到句子的表示,既获得了词语间的局部特征,又获得了全局的语义特征。3、针对带情感标注的中文文本数据集少的问题,通过网络爬虫的方式收集了六大领域的带情感标注的中文文本数据25000条,用于中文文本情感分类的研究。4、通过网格搜索的方式对超参数进行调节,使模型的训练达到最好的效果。并将三种模型的实验结果进行对比分析,C-LSTM模型确实在分类准确率上有所提高。