论文部分内容阅读
随着计算机技术快速发展,愈来愈多的网络用户通过社交平台表达对特定事物的看法。这些评论语料中蕴含大量的个人情感色彩,对这些内容加以分析利用,对预测商业形势以及社会发展态势有重要价值,这也促进了情感分析领域的发展。
对情感分析的主流方法分析如下:基于情感词典方法,该方法需要人为构建情感词典,词典构建的全面与否对准确率有很大影响。基于传统机器学习的方法,需要人工对语料进行标注,随后人工设计特征,最后使用相关机器学习算法完成任务。该方法对硬件要求低,但是依赖特征工程操作,对人力成本消耗较大。近年来,随着深度学习技术的不断成熟,使用深度学习模型解决情感分析问题受到广泛的关注。与前两种方法相比,深度学习模型在特征挖掘与序列建模方面更胜一筹;另一方面,其能够自动的挖掘语料深层次特征,省去了特征工程等人为环节,在情感分析任务中取得了不错的效果。
基于上述分析,本文设计并实现深度学习模型如下:
首先,依据卷积神经网络与循环神经网络各自特点与优势,将二者进行融合,构建结合多通道卷积神经网络和双向门限循环单元神经网络的MCNN-BGRU模型。模型采用多通道卷积神经网络进行有监督学习,在不同大小的窗口提取粒度不同的情感特征,从而识别更多的情感特征分类模式。双向门限循环单元网络能够挖掘跨度更广的语义依赖关系,有效识别文本情感极性。
其次,就文本中每一部分所蕴含的情感信息差异较大的问题,本文在MCNN-BGRU之上引入注意力机制。注意力机制能够帮助模型自适应地结合文本上下文信息,给与文本中重要程度较高的部分以高权重。
最后,在模型的训练阶段,为提升模型抵抗梯度弥散的能力,引入Maxout神经元,形成ATT-MCNN-BGRUM模型。将本文模型与实验组方法进行对比,实验结果证明本文模型在文本情感分类任务上有更好的表现。本文还对模型的训练过程与测试过程进行分析,对Maxout神经元的有效性进行实验验证。最后,对不同模型单一训练轮次的时间消耗分析,以说明本文模型训练性能的提升。
对情感分析的主流方法分析如下:基于情感词典方法,该方法需要人为构建情感词典,词典构建的全面与否对准确率有很大影响。基于传统机器学习的方法,需要人工对语料进行标注,随后人工设计特征,最后使用相关机器学习算法完成任务。该方法对硬件要求低,但是依赖特征工程操作,对人力成本消耗较大。近年来,随着深度学习技术的不断成熟,使用深度学习模型解决情感分析问题受到广泛的关注。与前两种方法相比,深度学习模型在特征挖掘与序列建模方面更胜一筹;另一方面,其能够自动的挖掘语料深层次特征,省去了特征工程等人为环节,在情感分析任务中取得了不错的效果。
基于上述分析,本文设计并实现深度学习模型如下:
首先,依据卷积神经网络与循环神经网络各自特点与优势,将二者进行融合,构建结合多通道卷积神经网络和双向门限循环单元神经网络的MCNN-BGRU模型。模型采用多通道卷积神经网络进行有监督学习,在不同大小的窗口提取粒度不同的情感特征,从而识别更多的情感特征分类模式。双向门限循环单元网络能够挖掘跨度更广的语义依赖关系,有效识别文本情感极性。
其次,就文本中每一部分所蕴含的情感信息差异较大的问题,本文在MCNN-BGRU之上引入注意力机制。注意力机制能够帮助模型自适应地结合文本上下文信息,给与文本中重要程度较高的部分以高权重。
最后,在模型的训练阶段,为提升模型抵抗梯度弥散的能力,引入Maxout神经元,形成ATT-MCNN-BGRUM模型。将本文模型与实验组方法进行对比,实验结果证明本文模型在文本情感分类任务上有更好的表现。本文还对模型的训练过程与测试过程进行分析,对Maxout神经元的有效性进行实验验证。最后,对不同模型单一训练轮次的时间消耗分析,以说明本文模型训练性能的提升。