基于Capsule Network的多源新闻评论细粒度情感分析

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:zifeng_ok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着移动互联网以及智能终端设备普及范围的不断扩大,读者获取新闻资讯的途径越来越丰富,在这样的背景下移动新闻客户端成为了读者最主要的新闻获取渠道之一,相较于报纸、电视等传统新闻媒介,其优势是新闻媒体与读者双方的互动更为密切,具体表现为读者在阅读新闻后通常会以发表评论的方式反馈自己的看法,同时媒体也会通过发起投票等形式主动获取读者的情感态度。为了帮助新闻媒体更便捷地获取读者的情绪反馈,同时尽可能多地挖掘出读者评论中蕴含的价值,本文希望能够找到一种有效的自动情感挖掘方式。文本情感分析的方法多种多样,从依靠情感词典及句法结构,到依赖人工挑选特征的机器学习方法,再到实现了自动特征提取的深度学习方法,文本情感挖掘工作越来越高效且准确性不断提升。本文分析并总结了读者情绪分析的研究现状,结合目前深度学习领域新提出的胶囊神经网络模型,深入研究了对由新闻引发的读者情绪进行自动判别的方法,主要工作内容包括:第一,本文摒弃了传统“非褒即贬”的二分类方法,综合考虑常用的文本情感划分方式及真实新闻评论数据集的情感分布特点,最终确定将读者评论划分为“愤怒”、“悲伤”、“支持”、“其他”四个类别。第二,本文融合了读者评论、新闻报道、“热门评论”的点赞情况三个数据源,借助多源数据来实现更全面且准确地挖掘读者情绪的目的。第三,本文探索性地将原本适用于图像识别领域的胶囊神经网络应用到自然语言处理任务中,调整了其网络结构,并依据文本类数据的相似性度量方式改进了模型中的动态路由过程,优化了分类效果。本文在真实的新闻评论数据集上进行了对比实验,比较了本文的分析方法与传统分类模型的效果差异,结果表明相较于已有的读者情绪判别方法,本文所使用的基于胶囊神经网络的多源新闻评论细粒度情感分析模型能够更准确地识别出读者的情绪。
其他文献
在小学数学的教学中,存在很多数学学习困难的学生,俗称“数困生”。数困生主要是指智力、生理机能正常但由于数学学习能力的不足导致其数学成绩落后,甚至不能达到数学课程标
利用13X型、13X+5A型、Y型、附载金属镍的13X型分子筛、高岭土等对FCC汽油进行物理吸附,脱除其中的硫化合物,结果表明:孔径较大的分子筛及比表面积大于150m2/g的高岭土对FCC
历史是一个国家、一个民族发展历程的写真,也是体现一个民族艰苦奋斗的真实写照。历史的学习,不仅仅是了解过去,看伟大的先驱们是如何克服当时的种种困难,也不仅仅是瞻仰他们,赞美他们,更是以史为鉴,以前辈们为榜样,珍惜现在的幸福生活的同时,去创造一个更加灿烂的明天,也提高自己的历史观和历史的核心素养。因此,历史的学习对于学生有着非常大的作用。在现在初中生历史学习中,如何去提高历史学习效率呢?在本文中,将围
新疆因丰富的蜜源物质和优质的地理气候条件,使得我区蜜蜂养殖业拥有了得天独厚的自然条件。本文从蜜蜂养殖场地和陈列方式选择、繁殖期管理、取蜂期管理和越冬期管理四个方
介绍编组站车号员与贷检员的作业特点,论述编组站在信息化建设中整合信息资源,建立车号货检信息共享平台的必要性。提出基于浏览器服务器相结合的车号赁检信息共享平台整合建设
入世后,我国会计市场将受到竞争加剧、人才流失等冲击.建立统一的会计规范体系、拓展服务领域、扩大规模、全面提高会计人员的综合素质将是可行之举.
朔黄铁路LTE集群语音系统是建立在专业调度指挥流程基础上,采用IMS架构和先进的技术将数据、语音等资源与调度指挥流程紧密结合,并加以灵活运用。介绍LTE语音系统的实现、集
多媒体技术是计算机系统将一些文字、图形、声音、影像等信息综合处理后再以计算机的格式输出.所 有这些信息都是以文件的形式存在的,可分为文本类文件、图形(图像)类文件、音频类文件、视频类文件、动画类文 件等5大类.对文件采集中常用的数据格式进行了简单地探讨,以求为教学中的多媒体应用提供帮助.
分析了有机化学教学的现状,认为有机化学的教学改革应打破课本模式,采用系统专题教学法、教具教学法、启发式教学法相结合的方式,以组织讨论、举行知识竞赛、改变传统考试方
TSRS-YH型临时限速服务器辅助设计CAD软件读取列控线路工程数据和网络配置数据,生成临时限速服务器和仿真设备的配置数据以及仿真测试用测试序列数据.软件采用面向对象的模块