面向互联网公众评论的情感分析方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:tingtngliok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,我们已经进入了大数据时代。在泛网物联的环境下,人们上网变得越来越容易,可以在任何时间、任何场合对网上感兴趣对象(如新闻事件、商品货物、民生舆论)进行个人的评价。因此会产生大规模的评论,在这些评论中,如果用户无法第一时间准确地找到自己感兴趣的评论,不仅会浪费大量时间,而且还会降低用户的上网体验。因此需要用合适的方法提取评论中的重要信息,使用户能够快速的定位。用户在网上进行的评论通常是一种情感的表达,具有主观性,因此可以通过对网络评论文本的情感分类达到方便用户检索和分析信息。本文提出了一种基于经典的情感词典方法进行分类,具体步骤为:1)通过爬虫技术爬取网络评论进行保存;2)对文本进行预处理,去除噪声数据;3)构建情感词典。但是由于基于情感词典本身所存在的不足,针对互联网公众评论多源、数据海量、篇幅较短、形式多样、信息量大、情感强烈的特点,本文又提出了基于深度卷积神经网络的面向互联网公众短评论的情感分类方法。相对于传统的情感分类方法,卷积神经网络在提取局部特征上具有得天独厚的优势,并且它的强大之处还在于两大特性:一是局部感知,二是参数共享。正因为这两大特点使得我们在训练的过程中可以大大减少训练参数。本文设计了一个8层的卷积神经网络结构作为面向公众短评论的情感分类器,使得在提取局部特征方面变得更为精确。该方法具体步骤如下:1)使用Word2Vec将评论文本转化为词空间向量;2)将二维矩阵文本转化为灰度图像格式;3)将图片数据输入基于深度卷积网络的情感分类器中进行训练学习,有效防止过拟合的产生,使模型拥有好的泛化能力;4)利用情感分类器对互联网公众短评论进行情感的极性判别。实验结果表明本文所提出的基于卷积神经网络的情感分类方法在准确率上要优于经典的情感分类方法,证明了该方法的可行性和有效性。
其他文献
钻进过程中包含有大量的随机因素,这些随机因素是影响钻井速度的重要因素。以往提出的钻井模式都是确定型模式,不能完整刻划钻进过程中的随机现象。本文对影响钻进过程的各种
华山自古就是受人崇拜的著名神山。其景观之险激活了人的探险天性,满足了人的审美诉求;其神仙传说释放了人的幻构潜能,满足了人对生命自由的渴望;其中所积淀的人文精神回应了
服装的风格和特点首先都是通过色彩的视觉幻想造成的,合理并且和谐的色彩组合通常能带来奇特的视觉效果,令人耳目一新。
依法治档已成为促进我国档案事业健康发展的必由之路。档案法制建设包括档案立法和档案执法两个重要环节,只有二者紧密配合,才能开创档案法制建设的新局面。
目的分析南平市2008-2010年手足口病流行特征,以了解流行现状和掌握流行规律,为制定有效的防控策略提供依据。方法采用描述性流行病学方法对国家疾病监测信息报告管理系统中
语言习得与教学语境创造谢之君1导言语言习得是指儿童随着发育成长而在周围环境的作用下获得母语的过程,如果没有生理疾病障碍,一般都会取得成功,获得语言能力。语言学习则指第二
<正>1一阵坚硬的风掠过白色城垛,枯蒿、黄叶、沙尘弥漫开了,与灰蒙蒙的天空再一次远远地连为一个整体。天空,蔚蓝色的天空悬着手指云纹,仿佛赫连勃勃征伐的铁骑,久久地走不尽
我国上市公司实际采用的股利分配方案中,主要包括现金股利、股票股利和不分配三种情况。对其的研究在深入了解二级市场股价波动及公司并购等方面产生重大影响。本文从宏观和
公共危机管理是各国政府无法回避的话题,政府信息公开状况对公共危机管理具有重要影响。我国公共危机管理中的政府信息公开在认知、制度、管理等方面都存在一定的障碍,需要进
目的分析探讨产科失血性休克危急重症患者的临床症状特点以及处理措施。方法对2013~2015年收治的42例产科失血性休克危急重症患者的临床资料进行回顾性分析,对其临床发病特点