论文部分内容阅读
随着信息技术的飞速发展,我们已经进入了大数据时代。在泛网物联的环境下,人们上网变得越来越容易,可以在任何时间、任何场合对网上感兴趣对象(如新闻事件、商品货物、民生舆论)进行个人的评价。因此会产生大规模的评论,在这些评论中,如果用户无法第一时间准确地找到自己感兴趣的评论,不仅会浪费大量时间,而且还会降低用户的上网体验。因此需要用合适的方法提取评论中的重要信息,使用户能够快速的定位。用户在网上进行的评论通常是一种情感的表达,具有主观性,因此可以通过对网络评论文本的情感分类达到方便用户检索和分析信息。本文提出了一种基于经典的情感词典方法进行分类,具体步骤为:1)通过爬虫技术爬取网络评论进行保存;2)对文本进行预处理,去除噪声数据;3)构建情感词典。但是由于基于情感词典本身所存在的不足,针对互联网公众评论多源、数据海量、篇幅较短、形式多样、信息量大、情感强烈的特点,本文又提出了基于深度卷积神经网络的面向互联网公众短评论的情感分类方法。相对于传统的情感分类方法,卷积神经网络在提取局部特征上具有得天独厚的优势,并且它的强大之处还在于两大特性:一是局部感知,二是参数共享。正因为这两大特点使得我们在训练的过程中可以大大减少训练参数。本文设计了一个8层的卷积神经网络结构作为面向公众短评论的情感分类器,使得在提取局部特征方面变得更为精确。该方法具体步骤如下:1)使用Word2Vec将评论文本转化为词空间向量;2)将二维矩阵文本转化为灰度图像格式;3)将图片数据输入基于深度卷积网络的情感分类器中进行训练学习,有效防止过拟合的产生,使模型拥有好的泛化能力;4)利用情感分类器对互联网公众短评论进行情感的极性判别。实验结果表明本文所提出的基于卷积神经网络的情感分类方法在准确率上要优于经典的情感分类方法,证明了该方法的可行性和有效性。