采用深度学习的文本序列分析方法及其情感推演研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wrmfw315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本序列是语义以至语意的抽象描述形式。任何基于自然语言的情感表达(例如电影评论和商品评论)都可抽象为某一类随机或者似随机性的文本序列。因而,在自然语言处理领域,针对文本序列的各种处理以及对蕴含于文本序列中的情感特征析取以及情感类型推断,成为人工智能研究中的重要的、也是极具挑战性的课题。本文从两个侧面开展了文本序列分析和情感语意推断的研究。一是研究如何建立随机文本序列的序列模型,二是研究如何通过卷积神经网络手段分析随机文本序列的情感特征并设计新的方法。本文首先对随机文本序列的各类基础模型(例如n-gram、word2vec、CBOW等等)开展了对比性的分析,然后指出朴素贝叶斯模型、支持向量机模型和最大熵模型是适合文本序列情感具体分析与推断研究的工作模型。然后,本文针对文本序列情感分析的卷积神经网络(Text-CNN)方法进行了较深入的研究。指出Text-CNN方法在处理文本序列上的优点是能够对输入样本进行特征提取以及降维处理,但池化层的池化操作会导致输入样本数据信息的损失,而且无法确定特征输出的长度。为此,本文使用一种通过空间金字塔池化(SPP)的方法来力求解决上述两个问题。此外,利用长短期记忆(LSTM)神经网络模型对于时间序列处理的有效性,将Text-CNN方法中的全连接神经网络层替换为LSTM神经网络层。最后,本文对Text-CNN方法进行改进,得到SPP-CNN-LSTM方法。利用该方法,在IMDB数据集和SST数据集上与4种基准算法模型(CNN、LSTM、SPP-CNN和CNN-LSTM模型)方法进行对比试验,结果表明在给定词向量训练模式下SPP-CNN-LSTM方法比其余4种方法的情感分类准确率提升3%~7%。进一步,本文还分析指出:CNN、LSTM、SPP-CNN、CNN-LSTM以及SPP-CNN-LSTM模型在动态skip-gram(DSG)词向量训练模式下的性能优于其他词向量训练模式下的性能。在DSG模式下,实验模型的文本情感分类性能依次递增,在IMDB和SST数据集上的平均准确率分别约为73.2%、75.1%、78.3%、79.6%和83.0%。
其他文献
合理的主位推进模式能够提高语篇的衔接性和连贯性。本文基于主位结构理论,以一篇学生作文为例,具体分析学生在作文中易犯哪些有关主位结构方面的错误,以及课堂教学中如何引
目的研究联合检测血清半乳糖凝集素-3(galectin-3)、可溶性白细胞介素2受体(solubleinterleukin2receptor,sIL2R)、嗜酸性粒细胞趋化因子(CCchemokineligand11,eotaxin,CCL11
目的分析在基层医院药师开展对临床不合理用药的药学干预方法及效果。方法收集该院2016年至2017年临床不合理用药情况及药师采取药学干预后的相关资料。结果 基层医院药师对
目的探讨临床药师对呼吸内科开展药学服务的模式和方法。方法 结合临床药师的实际工作,选用典型案例,利用相关药学知识,通过多种针对性的药学服务实践,给医生、患者提供相应
多孔介质广泛存在于自然界和各种工农业生产场景中,其中包含的互不相溶多相流体之间具有复杂的流动特性。对这种形式的流动进行建模和求解,对于提高采油工业的生产效率、地下
近年来,通信行业发展迅速,成为影响国民生产和生活的重要行业,随着行业的不断发展,企业内部的各项管理制度不断完善,财务部门作为企业内部重要的管理部门,直接为企业管理层提
嵌岩桩是桩基础中的一种重要类型,其承载力一般包括上覆土层摩阻力、嵌岩段摩阻力和嵌岩段端阻力。目前国内规范中嵌岩桩竖向承载力设计方法主要为安全系数法,将荷载、抗力和
<正>时间,定格在这一刻。中国大地上有数百台印刷机在飞速转动,不同的报头之下出现同一个标题;大学校园的阅报栏前,无数学子闻风而至,争相阅读同一篇文章;不知有多少人铺展稿
目的讨论一次性根充法与分次根充法在急性牙髓炎治疗中的临床效果。方法研究时间为:2018年7月~2018年12月。研究观察对象为:本院收治的80例急性牙髓炎患者,将其以随机法分为
本论文研究了有机蒙脱石、有机坡缕石和有机海泡石在油基钻井液体系中的流变性能和调控机制,从矿物结构、矿物化学以及界面反应的角度探索了有机黏土在油基钻井液中流变性的