网络用户的情感倾向挖掘方法与系统研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:X2000N
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展与信息技术的不断推陈出新,以及智能设备的普及化,互联网已大面积覆盖人们的学习、工作、生活、出行、娱乐等领域。人们会在不同平台分享自己的观点、表达自己对热点事件的态度、评论商品的质量,通过网络文本表达自己的感受和情感。挖掘文本中用户的潜在情感倾向,对产品调研、市场分析、网络舆情预警等应用有巨大的商业价值和社会意义。文本情感分析方法可分为基于情感词典的方法和基于机器学习的方法两类。基于情感词典的分析方法依赖情感词典,情感词典的质量直接影响模型的分类效果。该方法虽然简单,但是需要耗费巨大的人力维护词典,并且模型不具有可移植性。传统机器学习方法提取文本特征时需要领域专家的参与,不同领域的文本特征建模是有所区别的,因此也没有妥善解决人工成本和可移植性问题。针对基于词典和传统机器学习方法在文本情感挖掘方面的不足,本文将卷积神经网络(CNN)和注意力(Attention)机制相结合,设计了适用于网络用户情感分类的模型(MWABCNN)。在理论模型研究的基础上,设计了网络情感分析原型系统,本文具体工作如下:第一,在研究文本情感分析的词向量结构基础上,对现有词向量训练模型进行对比实验研究,设计了基于word2vec和GloVe模型的词向量的训练方法。采用维基百科和微博语料进行了预训练实验研究,结果表明预训练的词向量性能优于随机初始化的词向量。第二,设计了融合多通道的卷积神经网络与注意力机制的新型神经网络模型(MWABCNN)。分别与朴素贝叶斯算法、支持向量机和循环神经网络分类算法进行了对比实验研究,结果显示了MWABCNN模型在网络文本情感分析的性能优势。第三,研究了MWABCNN模型的参数优化,根据输入词向量的静态(static)与非静态(non-static)、卷积核的大小、dropout概率、训练语料的大小等参数,设置了多组不同的对照试验来验证这些参数对模型分类准确率的影响,并对参数进行调优。第四,在研究文本情感分析的理论模型基础上,设计了基于深度学习的网络文本情感分析的原型系统(NUSAS),并对该系统进行了实现与测试。
其他文献
伴随着社会的发展进步以及电子游戏产业的不断发展和完善,电子游戏逐步融入到大众特别是青少年的生活中,成为一种普遍的娱乐方式。然而,电子游戏在内容、画面等各个方面的设
近年来,我国通过发展大规模、远距离输电工程,全面建设特高压输电工程来解决区域性电力能源供需不平衡问题,特高压输电工程是一个复杂的系统,较常规输电工程,具有输电线路更
学习动机是制约学生学习效果的直接因素,理解动机原理及在教学设计中恰当应用就成为提高教学质量必不可少的内容。本文具体介绍了一种在国内外具有广泛影响并已逐步应用于教学
目的:探讨心脏B超和心电图在高血压性心脏病诊断中的应用价值。方法:选取2009年10月-2012年10月笔者所在医院收治的100例高血压性心脏病患者,对其临床资料进行回顾性分析,对比分
春节团圆时刻,在品尝丰盛年夜饭、叙情话旧的同时,一款款金丝猴新品给我们的春节增添了许多喜庆和甜蜜的味道在糖果业中,金丝猴公司是一个不能忽略的重要角色,近年来,除了极
美国政府2000年制订的21世纪《信息系统保护国家计划》在信息安全发展史上是一篇具有里程碑意义的文档,我们在上一期杂志中刊登了对这篇计划的介绍分析后,很多读者和单位对此非
随着塑料制品应用的日益广泛,注塑成型加工正在全世界范围内变得普及。中国作为注塑工业的最大市场,如何能够高质量、低成本地培养注塑加工专业技术人才及合理预测注塑制件的
特应性皮炎是一种与遗传过敏素质有关的特发性炎症性皮肤疾病,可分为外源型和内源型两种类型。该疾病是一种多基因病,病因复杂,发病机制尚未明确,现认为该病主要是由遗传、环
张家口正大力推进新型城镇化建设,努力实现全面建成小康社会的总目标,这就需要转变农村党建工作理念,提高对新型城镇化进程中农村党建工作重要性的认识,对农村党建工作重新定
<正>一、集团公司及控股公司层级介绍Z公司是X集团(集团公司2级全资公司)的控股子公司(集团公司3级),X集团持股比例为70%,甲公司持股比例为30%。Z公司是高新技术企业,所得税