基于多尺度特征提取的文本情感分类研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:westbulls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类是自然语言处理领域中的一个重要问题。理解文本的语义,对文本进行分类,其核心问题是提取文本的特征。现有模型大多通过叠加CNN、LSTM或GRU网络来解决这一问题。但LSTM和GRU网络是单向时序模型,仍然偏向保存文本后端特征而遗忘文本前端特征。双向LSTM或双向GRU网络虽然能保存文本的前端和后端特征,但模型复杂参数量巨大,由于数据集相对有限,如果利用双向LSTM或双向GRU网络容易导致特征冗余和过拟合。上述模型对不同尺度的特征都无法有效提取。针对以上问题,提出融合多尺度特征提取的文本情感分类模型,提升文本情感分类的性能。本文工作主要包括以下两个方面:(1)针对无法提取多尺度特征问题,考虑多尺度n元特征,提出一种简单有效的融合多尺度特征提取的正交独立GRU(Multi-Scale Orthogonal In Depend Ent GRU,MODE-GRU)网络模型。将GRU模型的隐藏状态拆成多个小隐藏状态,并正交约束其对应的递归矩阵,定义多个不同大小的滑动窗口,将滑动窗口得到的不同文本片段分别叠加输入到模型,再将多个小GRU模型的输出结果拼接和soft池化。并使用改进的Focal损失函数加快收敛速度。(2)针对单向时序模型偏向保存文本后端特征而遗忘文本前端特征问题,提出双向MODE-GRU模型(Multi-Scale Orthogonal In Depend Ent Bidirectional GRU,MODE-Bi-GRU)。将双向GRU模型的隐藏状态拆成多个小隐藏状态,并正交约束其对应的递归矩阵,分别按照文本的正向和反向两个角度定义多个不同大小的滑动窗口,将滑动窗口得到的不同文本片段分别叠加输入到模型,再将多个小双向GRU模型的输出结果拼接和soft池化。并使用改进的Focal损失函数加快收敛速度。在四个基准数据集SST2、SST5、TREC和MR上测试了本文所提出算法的性能,并与现有的基线模型进行对比实验,实验结果表明:提出的MODE-Bi-GRU模型较CNN-LSTM、Bi-LSTM模型分类效果更好,在SST2、SST5、TREC和MR数据集上的准确率都有所提升。融合多尺度特征提取的文本情感分类模型能够获取文本不同尺度特征,提高分类任务准确率。该论文有图17幅,表6个,参考文献68篇。
其他文献
正义作为价值观领域中的基本问题一直是古今中外学者探讨的焦点,对社会现实状况和无产阶级生存环境高度关心的马克思在他的著作中多次表达了自己的正义观点,他历史性地考察了人们思想与行为背后的物质经济原因,创造性地发现了历史唯物主义,明确了在全部正义问题中,经济正义起着根本性的作用;同时他既肯定资本主义推翻封建专制的先进性,也指出资本主义最终只是使社会从一种专制走向另一种专制。剩余价值理论的发现扯掉了资本主
学位
<正>在深化检察改革的进程中,精准监督已成为民事检察科学发展的新思路和新动力。面对新时代新要求,进一步深化精准监督,能为民事检察监督标准、方式以及程序的重塑提供有益指导。一、民事检察精准监督的界定学界对于精准监督的界定尚未形成共识。有观点认为精准监督内涵包括监督方向精准、监督质量过硬、监督效果良好。1也有观点认为,精准监督在于方法与目的、投入与产出之间实现匹配和平衡,监督准、质量高、效果好则属于精
期刊
随着配备触摸屏幕的多媒体终端逐渐发展和普及,“所触即所得”的二维触控操纵凭借其直观、简便、灵活等优点成为多媒体终端主流交互方式。然而,随着科技发展,多媒体终端种类逐渐增加,桌面呈现信息量急速膨胀,使用场景从稳定安全的室内环境扩展到更为复杂的综合环境中,包括走路、跑步、购物等多种生活场景,此时,传统二维平面交互逐渐暴露一些问题。首先,手指与笔尖相比,接触面积较大,在有限大小屏幕上存在视线遮挡问题。其
学位
近年来,由湖泊富营养化现象导致的藻类恶性增长已成为严重的水环境问题,对湖泊生态环境建设及可持续发展造成严重威胁。通过合适的模型提取湖泊藻类覆盖范围,统计分析藻类覆盖度,探究促进藻类生长的主要驱动因子,对有效预防湖泊水质恶化、建设可持续发展的湖泊生态环境具有重要的借鉴意义。本文以黄河流域最大的淡水湖泊乌梁素海作为研究区,提出基于藻类光谱异质性的FNEA算法结合FAI光谱指数模型实现藻类覆盖范围提取。
学位
带式输送机因长运距和大运量等特点,深受煤矿等散料运输领域的青睐,转运站是带式输送机输送散料的关键设备。随着科技的进步,带式输送机向着智能化、低污染、高效率方向发展,因此对转运站的可靠性和输送性能提出了更高的要求。为提高转运站可靠性和输送性能,对转运站结构进行设计是解决问题的关键。本文使用离散元软件对转运站进行仿真分析,运用单因素试验法,从物料种类及特性、转运站结构参数、转运参数出发,分别研究物料粒
学位
背景:癌症作为全球第二大死因严重威胁人类生命和健康。癌症转移是癌症死亡的主要原因,癌细胞的上皮间质转化(EMT)促进了癌症的转移。Pre-mRNA的剪接调控细胞生长、分化与组织发育,剪接失调影响多种癌症的发生发展。剪接过程由剪接复合体催化完成,剪接因子SF3B1(splicing factor 3 subunit 1)是剪接复合体中 U2 snRNP(Small nuclear ribonucle
学位
自动驾驶技术具有大幅提升交通运输安全性、舒适性和效率的潜力,已经成为时下的研究热点。随着交通场景复杂度的提升,自动驾驶车辆需要更加智能的决策和规划系统来避免交通事故。考虑到决策和规划系统需要获取周车的未来轨迹来评估行车风险,这使得车辆轨迹预测模块逐渐成为自动驾驶汽车功能架构中的重要组成部分。车辆轨迹预测模块以周围交通参与者的历史状态以及结构化道路交通规则等环境信息作为输入,通过数据推理和模型递归等
学位
煤炭开采活动在促进经济发展的同时,难以避免的破坏矿山生态环境,在水热动态变化和人类活动的双重压力下,造成植被愈发裸露、土壤养分流失等诸多问题。不断恶化的生态环境脆弱性已成为当前矿区生态修复的热点问题,对单一环境因子的探讨已经不能满足整个生态系统恢复的需求。因此,本文通过选取相关环境限制因子,利用遥感解译分析地表环境问题,探究矿区生态脆弱性的时间、空间尺度特征,及时掌握矿区生态环境脆弱性的动态发展,
学位
为探究不同复垦模式对海州露天矿排土场的生态修复效果,本研究以阜新海州露天矿排土场为研究对象,选取排土场内刺槐林地、白榆林地、刺槐白榆混交林地(以下简称为混交林地)、农田、草地五种复垦模式,以裸地为对照,对海州露天矿排土场不同复垦模式内小气候因子以及土壤因子进行测定,并利用主成分分析法评价不同复垦模式生态修复效果。研究结果如下:(1)排土场不同复垦模式内光照强度、大气温度、相对湿度、平均风速、土壤含
学位
为深入理解真菌多样性及其对环境变化的响应,揭示青海云杉适应本地高寒与干旱逆境的土壤微生物组作用机制,采用Illumina MiSeq高通量测序技术,分析了青海云杉Picea crassifolia根围土壤真菌多样性和群落组成及对海拔变化的响应。青海云杉根围土壤中共获得1179个真菌OTUs,隶属于10门43纲100目191科276属。在门水平上,担子菌门Basidiomycota和子囊菌门Asco
期刊