面向手机动画的基于深度学习的中文短信情感分析

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:wlm7411814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能与计算机相关技术的发展,上世纪九十年代,中国科学院数学研究所陆汝钤院士提出了结合人工智能和计算机动画技术的全过程计算机辅助动画自动生成技术。近年来,移动网络发展迅猛,中国科学院张松懋研究员于2008年提出将全过程计算机辅助动画自动生成技术应用到手机短信中的想法,并完成了手机3D动画自动生成系统的设计与实现,该系统将人工智能技术与计算机动画技术相结合,针对输入的中文短信,经过信息抽取、定性情节规划、定量动画计算、网络渲染四大步骤之后,最终将生成的视频动画发送给短信接收者。信息抽取是手机3D动画自动生成系统中的第一步,位于关键的位置,其主要作用是抽取出中文短信文本中可动画化的信息,而短信情感分析作为信息抽取的一部分,目的是分析出短信中包含的情感信息,为后续情节规划表达情感提供有力的参考依据。动画系统中现有情感分析系统分类的准确率不高,无法达到实用的目的,为此,本文提出采用深度学习的方法对中文短信文本进行情感分析,针对动画的可展现性将短信文本中的情感分为喜、怒、哀、惧四类。本文的研究工作主要包含以下两部分。第一,设计并实现了一种将长短时记忆网络(Long Short-Term Memory,LSTM)和卷积神经网络(Convolutional Neural Network,CNN)相结合的情感分析模型LSTM_CNN,进行中文短信文本的情感分析。其中,文本使用词向量技术表示,卷积神经网络模型使用卷积和池化操作进行特征抽取,LSTM模型保存文本的序列信息,使用其特有的门结构进行特征抽取。实验使用SMS-2008标注中文短信息库中的10万余条短信作为初始语料库,经过预处理之后得到含有喜、怒、哀、惧情感的短信共18163条,在此数据集上训练分类模型。实验结果表明,我们设计的长短时记忆网络和卷积神经网络结合的LSTM_CNN模型性能优于仅基于卷积神经网络和仅基于长短时记忆网络的分类器,准确率达到84.45%,召回率为84.56%。第二,设计并实现了基于主题注意力卷积神经网络情感分析模型。注意力机制可以自动计算短信中每个词对目标输出结果的重要程度,即注意力权重。主题是短信内容的凝练,是短信的中心思想,手机3D动画自动生成系统中的信息抽取模块通过基于规则的方法对短信进行主题分析。为使注意力机制与手机3D动画自动生成系统中的信息抽取相融合,本文创新性地提出将抽取得到的主题作为注意力机制的一部分,与卷积神经网络相结合进行短信文本情感分析。训练之后得到分类模型准确率达到85.82%,表明了引入主题和注意力机制方法的有效性。最终手机3D动画自动生成系统选用此模型进行情感分析。在2017年12月7日到2018年3月20日手机3D动画自动生成系统运行期间,我们对基于主题注意力卷积神经网络分类模型进行开放性实验,系统共收到短信230条,其中由于系统更新程序等问题出错30条,分类为客观性的短信为136条,对于主观性的64条短信,我们设计的情感分析系统分类正确的为54条,准确率为84.38%,达到在手机3D动画自动生成系统中实用的目的。本文设计并实现了面向手机3D动画自动生成的基于主题注意力卷积神经网络模型的中文短信情感分析系统,开放性实验表明了模型的有效性,进一步的工作包括集成多模型、处理不均衡语料、处理一词多义等来提高性能等。
其他文献
随着互联网的快速发展,在线社交网络逐渐影响人们的生活,成为现代人必不可少的交往方式。通过在线社交网络,人们可以随时随地通过文字、图片、视频等方式跟世界各地的好友分
中国自1978年实行改革开放政策以来,在对外直接投资(Outward Foreign Direct Investment,下文简称为OFDI)方面取得了巨大成就。截止至2015年,中国境内投资者共对全球155个国
在过去的几十年中,人们对离散事件系统(DES)的状态估计和故障诊断问题进行了广泛的研究。一般来说,为了解决状态估计和故障诊断问题,所研究系统的输出信息必须被给出。通常,
旅游业是既年轻又具有发展潜力的产业之一,21世纪旅游业将成为世界最大产业之一和全球服务业中增长速度最快的行业,旅游业和通讯、信息技术将成为推动21世纪经济发展的主要动
培训评估是检验培训项目成败的重要标准,培训评估所获得的信息是改善培训决策的主要依据,培训评估不仅能对培训质量做出恰当的评价,而且评估过程能帮助培训部门发现培训各环
边缘检测是图像处理研究领域的基础,是图像分割、模式识别的前提,是图像处理过程中很关键的一步。现有的边缘检测算法中常存在边缘不连续、定位不够精准、检测出的边缘存在伪
随着互联网的发展和信息化时代的来临,文件云存储技术进入了高速发展时期,越来越多的个人用户和企业用户通过云存储系统存储、共享和传递文件数据,云存储系统通常需要使用专
支持向量机(SVM)是由统计学习理论发展而来的一种被广泛使用的机器学习分类算法,但是在具体问题中核函数及其参数的选择是决定支持向量机泛化能力的关键因素。本文通过引入泛
在大数据时代的今天,云计算作为一种服务模式,为信息技术部门、科研部门、商业部门等提供动态可扩展服务。虚拟机实现了物理资源的逻辑隔离,可跨系统的为用户提供服务并支持
随着微信这一应用的迅猛发展,在微信公众号上给用户发送图片信息成为微信开发的一个重点。很多时候,我们发送的不仅仅是一幅简单的图片,而是在原有图片的基础上,嵌入带有用户