基于机器学习的多粒度文本情感分类方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网逐渐地深入人们的生活,用户已经习惯了在各大平台上分享和发表自己的观点,这些包含着大量用户行为数据的评论文本为开展文本情感分类研究提供了强有力的数据支持。文本情感分类作为自然语言处理领域的研究热点,相关的模型研究和应用拓展一直以来都备受研究者的关注。根据文本情感粒度的不同文本情感分类可分为句子级文本情感分类和目标级文本情感分类。当一个句子中包含多个目标实体和情感时,句子级情感分类任务会存在较大的情感判断偏差。为了解决句子级情感分类任务这一局限,本文在此基础上进行了更加符合人们认知习惯的目标级文本情感分类任务的研究。尽管文本情感分类任务的模型研究已经取得了许多成果,但仍然有许多地方值得改进。首先,先前的句子级情感分类模型很少关注神经网络模型中由于大量非线性函数的多层映射所导致的信息损失问题。其次,在目标级文本情感分类模型中大量的研究未充分地利用目标词三分句子的任务特性。同时,之前研究也未曾考虑情感分类模型的可落地性以及应用价值。本文根据现有模型在句子级和目标级文本情感分类任务中存在的不足,分别设计了两种深度学习的情感分类模型,并通过案例研究得到了每家店铺的总体得分和区域内的口碑分析结果。论文的主要工作和贡献概括如下:(1)在句子级文本情感分类任务中,提出了一种基于特征融合的对抗循环神经网络模型(FARNN-Att)。针对非线性激活函数的稀疏激活性导致的信息损失问题,FARNN-Att模型在双向长短期记忆网络(Bi-LSTM)的基础上,通过构建特征连接层不仅充分地利用了预训练词嵌入信息,而且很好地缓解了模型在前向传播过程中的信息损失。另外,通过添加注意力机制和对抗训练模块提升了FARNN-Att的模型性能和鲁棒性。最后,实验验证了FARNN-Att模型的优异表现和有效性。(2)在目标级文本情感分类任务中,提出了一种三通道特征增强的深度交互网络模型(TFEI)。之前的研究未能将目标词三分句子的任务特性引入到预训练的语言模型,并进行充分挖掘。为了彻底地激发该特性在目标级文本情感分类任务中的应用潜力,TFEI模型以BERT语言模型作为基础,巧妙地利用该特性构建了三通道的特征提取方式。同时,TFEI模型还利用不同的通道输入形式和交互学习更加充分地挖掘了目标词与上下文之间的语义关系。最后,实验验证了TFEI模型在所有数据集上的杰出表现和有效性。(3)在模型应用和案例分析中,研究了FARNN-Att模型在口碑评价中的应用。在得到FARNN-Att模型预测结果的基础上,通过联合模型的预测结果和店铺评论数构建了店铺的整体评价模型,从而得到每家店铺的得分。最后,分析了店铺得分与人均消费价格和评论数之间的关系,以及可视化展示了研究范围内店铺得分在空间上的变化趋势和差异。
其他文献
现有喷砂除锈设备因存在承载能力较低、可移动性较差等不足,难以运用于具有U型肋等复杂曲面的大型钢箱梁喷砂除锈自动化作业,为此,本课题组基于Stewart并联结构独创研制了一种钢箱梁喷砂除锈并联机器人。表面粗糙度作为检验喷砂质量的重要技术指标,直接影响涂层附着力,且关乎桥梁钢箱梁的防腐性能,本文着重研究该并联机器人考虑表面粗糙度约束的喷枪轨迹规划问题,主要解决两个难点:(1)钢箱梁喷砂除锈作业的漫天粉
在全球经历了几次环境、技术和社会变化后,企业意识到更经济、更环保、更负责任的供应链可以拥有更好的企业绩效,可持续供应链应运而生。绩效评价的好坏反映了可持续供应链的运营情况,绩效评价有助于企业发掘自身运营的优缺点,优化企业生产资料配置,降低资源浪费,缓解社会压力,使企业在经济、社会、环境三方面实现平衡发展。我国半导体企业在供应链结构设计阶段投资巨大,生产物流阶段主要面临着产品技术落后、过分依赖进口、
涡旋压缩机作为工业生产和日常生活中广泛使用的关键机械设备,一旦在运行过程中出现异常状态或突然故障,将直接影响整个机械系统的正常运行,造成巨大的经济损失,甚至危及人身安全。因此,深入开展涡旋压缩机状态监测和故障诊断技术的研究,对保证机械设备安全平稳地运行具有重要的现实意义。本文以涡旋压缩机为研究对象,在研究变分模态分解的基础上,将其分别与奇异值分解、1.5维能量谱、多尺度排列熵以及支持向量机等方法相
我国是农业大国,近年来农业装备向机械化、智能化和无人化实现了跨越式发展。作为农业装备重要组成部分的果园无人农机,具备果园作业效率高、人工成本低等优势,应用需求量大。为保证果农和操作人员安全,避免事故发生,无人农机必须具有实时障碍物检测和局部避障路径规划的功能。本课题主要研究内容如下:(1)基于果园无人喷雾机硬件平台构建障碍物检测及避障系统。双目视觉摄像头实时获取果园环境图像;嵌入式计算机对获取的图
“分工”是马克思主义理论的重要范畴,分工理论是马克思主义理论的重要组成部分。马克思创立历史唯物主义和剩余价值理论,都与马克思对分工问题的研究,尤其是对资本主义生产方式下工厂内部分工的深入研究密切相关。深入、系统地研究马克思分工理论,有助于科学把握历史唯物主义,有助于深入理解剩余价值理论。马克思以分工为线索,深刻分析了造成劳动异化的原因,指明通过消灭资本主义私有制,扬弃分工异化,实现人的自由自觉劳动
随着钢铁工业的发展,钢渣的排放量持续增加。现阶段国家大力推动固体废物处理利用标准体系建设,开展了许多固体废弃物处理工作,但是钢渣的利用率依然很低。同时,陶瓷原料资源匮乏,迫切的需要寻找新的替代原料。因此,将冶金钢渣运用到制备多孔陶瓷中具有重要意义。以冶金钢渣为主要原料,分别采用高温化学发泡法、常温直接发泡法和有机泡沫模板法制备高气孔率、低密度的多孔陶瓷并分析了样品的体积密度、抗压强度和气孔率的变化
自1887年氰化工艺用于工业生产以后,该工艺以较高的浸出效率、较低成本以及对不同矿物较好的适应能力等优点一直作为金银生产的主要途径,由于此工艺使用具有剧毒的氰化物,使得尾矿中也含有氰化物,不能直接排放,氰化渣的处理成为难题。本文进行了将氰化渣作为硫铝酸盐水泥熟料铁质和硫质材料替代物的基础研究,考察了将氰化渣作为水泥生产原料的配料设计、原料选择、烧结温度、保温时间等条件对熟料的物相生成、固硫率、游离
随着我国冶炼铜技术的发展,铜的产量不断增加,随之而来的铜渣排放量逐年攀升。由于铜渣中含有大量的铁和可观的铜,可以认为是一种优质的二次资源,但大量铜渣依旧作为固废堆存。为实现铜渣中铜和铁的高效率、低能耗的提取和铜渣无渣化综合利用,课题组提出“铜渣微波固相还原-熔分(或选矿),获得含铜铁水,进而制备含铜耐磨铸铁”的新思路,本论文主要研究其中微波固相还原铜渣过程。本论文对铜渣微波碳热固相还原过程进行了热
近年来随着海上平台石油开发、大型码头等工程的兴起,立式长轴消防泵的需求量不断增加,这也对其性能提出更高的要求。受潮汐、海浪、台风等影响,立式长轴消防泵在高淹没深度无空化激励的条件下,电机功率随着流量的增大而极剧增加,存在电机功率过载的危险;又因该类装备动力系统复杂,烧毁损失巨大,所以通常采用较大安全系数配套,不过因此也存在着能源浪费的问题。采用离心泵无过载理论进行设计,可以在水力设计阶段控制功率极
碳颗粒物(PM)排放一直是各类柴油机动力机械尾气后处理技术的控制重点。PM粒径分布广泛,其中粒径小于100纳米的超细颗粒对人体和环境都极具危害。柴油机颗粒物捕集器(DPF)能将排气流中的PM高效过滤,但必须对沉积在过滤孔道中的积碳进行适时清除,即DPF的再生。低温等离子体(NTP)具有强氧化性,能将PM在远低于起燃温度的条件下氧化分解,是一种新型的动力机械尾气净化技术,而填充床介质阻挡放电(PB-