基于神经网络模型的文本情感分析系统的研究与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:zygqqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪,深度学习框架的提出使很多图像和语音领域的问题都得到了突破性的进展。在自然语言处理领域,深度学习模型也取得了不错的效果,特别是在文本分类任务上,一些典型的神经网络的应用将文本分类的准确率提升了很大的幅度。从整体来看,在使用基于深度学习的神经网络模型进行文本分类的任务时候,有两个步骤是十分关键的:1将文本中词语转化成词向量;2将词向量序列合理地编码为句向量。现有的深度学习模型虽然在文本分类上取得了不错的效果,但是在这两个步骤中都存在着一些缺陷。本文针对现有模型在这两个步骤中的缺陷,提出了如下两种改进的网络模型结构。一、在将词语转化为词向量过程中,已有的基于深度学习的模型都是直接使用word2vec等无监督的词向量生成策略,将词语看成是不可拆分的最小单元,通过词语之间共现的概率将词语映射到向量空间中去。这类方法只是考虑了词之间的位置统计关系,并没有考虑到词语本身所包含的结构信息。无论是中文还是英文,词语本身的形成都具有一定的规律性,本文提出的基于构词法的神经网络文本情感分析模型,通过神经网络结构自动地从词语中提取出结构信息。二、在将词向量序列编码为句向量过程中,已有的基于深度学习的模型都是单独使用卷积神经网络或者循环神经网络。但是卷积神经网络在提取情感特征方面存在局部性的缺陷,循环神经网络在提取情感特征方面存在序列偏置的缺陷,这些缺陷将会影响最终模型的分类性能。本文针对这两种网络结构的特性,提出了基于情感信息收集-抽取架构的文本情感分析网络,使用合理的方式将卷积神经网络和循环神经网络进行了有机组合。基于上述提出的两种改进的神经网络结构,本文研究与实现了面向微博的文本情感分析系统,全面介绍了整个系统的四个主要功能实体:1数据抓取与预处理模块;2数据分析模块;3数据存储模块;4数据展示模块。同时详细介绍了这四个功能实体的内部设计细节,并在最后进行了系统的测试与前端展示。
其他文献
梯级泵站能耗大,对其进行优化调度,节能效果显著。结合一梯级泵站的实际,建立了级间无分水任务的梯级泵站优化调度的动态规划数学模型,给出了优化调度图。阐明了改善级间流量配合
人力资源管理水平的提高关系到旅行社行业整体素质的提高以及行业的发展方向。文章阐述了浙江省金华市旅行社业在人力资源管理上存在的观念落后、管理制度不健全、人力资源配
《红色中华》是中国共产党在革命根据地所创办的第1份中央机关报,也是中央苏区发行量最大、传播最广、影响力最强的一份报刊。毛泽东对这份报刊的创办、发展作出了突出贡献,
目前长春市节能减排存在的问题主要有经济发展处于高耗能阶段、产业结构调整面临巨大压力、能源生产和消费的比例不尽合理等。解决问题的主要对策为加快技术进步和产业结构调
大力推进学习型城市建设,是构建学习型社会的重要组成部分,也是我国全面建设小康社会、加快推进社会主义现代化的战略选择。十二年前,上海在全国率先提出“构建学习型城市”,十多
报纸
“新时代呼唤新担当,新时代要有新作为”,党的十九大和全国教育大会开启了新时代中国特色社会主义教育现代化建设新征程,吹响了建设教育强国的奋进号角,也赋予了教育督导新的历史
报纸
采集红嘴鸥的粪便并进行细菌分离培养,首次分离到产酸克雷伯菌。红嘴鸥产酸克雷伯菌在普通琼脂、麦康凯、伊红美蓝(EMB)、营养肉汤及SS琼脂培养基上均可生长,多数为单个存在或
目的探讨不同剂量美托洛尔对无症状左心室收缩功能障碍患者左心室重构的影响。方法选取成都市青白江区人民医院自2015年1月至2016年1月门诊及住院无症状左心室收缩功能障碍患
本文介绍RPC(Remote Procedure Call,远程过程调用)和网络文件服务器,通过实例详细讲解了怎样利用LinuxRPC编写网络文件服务器端程序.
现代供应链比以往任何时候都更容易遭受风险,供应链的风险主要来源于内外部环境、供应链行业产品背景、供应链上下游关系、决策支持等多个方面。研究发现,需建立信息共享机制