基于多粒度分析的外卖平台数据用户情感分析

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:hanxu0214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着外卖软件的不断发展和成熟,越来越多的人开始选择在网上订餐。而外卖平台为了让更多用户从外卖商品的品质、口感、质量甚至是服务等方面进行评价,开通了点评功能。这一功能也逐步成为用户用来决定是否下单的重要依据,因此对外卖用户的评论进行情感分析来帮助用户更好地获取外卖平台的信息,成为当下学者广泛关注和研究的热点课题。本文通过对获取自美团外卖平台的真实数据开展研究,采用双向长短时记忆网络(Long Short-Term Memory,LSTM)提取外卖评论数据中的时序特征,并结合自注意力模型对外卖评论语句中前后文的语义关系进行充分提取;在此基础上对外卖评论数据进行多模型训练,发挥不同网络模型的优势从而取得更优效果;最后基于上述算法开发了外卖评论数据情感分析原型系统,从而为外卖商家、消费者及运营平台提供借鉴。本文方法经过大规模数据测试,能够对绝大多数外卖评论数据实现较为准确的情感分类。本文的主要研究内容有以下几个方面:1.提出了基于自注意力机制的双向LSTM外卖评论数据情感分类模型双向LSTM可以充分获取文本前后的逻辑关系而被广泛应用于自然语言处理等领域。本文为充分获取外卖评论数据前后文特征,首先提出双向LSTM外卖评论数据情感分类网络,并在此基础上引入自注意力机制充分发掘和学习外卖评论数据中的相关规律,使得外卖情感分类结果更加准确可靠。2.提出了基于多模型融合的外卖评论数据情感分类模型在双向LSTM网络对数据进行特征提取的基础上,采用操作简单、训练迅速、广泛应用的端到端的模型对外卖评论数据进行学习训练。随后分别利用fast Text模型、BERT-MRC模型等模型对外卖评论数据展开训练。在这一过程中,充分利用fast Text模型网络简单但性能优异、BERT-MRC模型性能更优的优点,强化对外卖评论数据的特征提取工作,使得外卖评论数据情感分类结果有明显提升,并最终实现对外卖评论数据情感倾向的多粒度识别分类。3.设计并实现了自动情感分析原型系统为应用本文提出的外卖平台数据情感分析方法,本文设计并实现了基于B/S架构的自动情感分析原型系统。该系统包括外卖评论数据采集、原始数据预处理、外卖评论数据情感特征的提取、训练及外卖评论数据的情感分析等功能,给用户提供了一个便捷、简单、易于操作的自动情感分析方案。通过多种应用示例进行展示,验证本文算法和本系统的有效性和实用性。
其他文献
在如今的大数据时代,每天都有海量的信息产生,互联网已经成为人们表达观点、获取信息的重要途径,网络用户从过去单纯的信息获取者变为网络内容的主要制造者。当用户在使用微博、电商等平台时,会针对某事件或某产品发表自己的看法和观点,产生大量的具有个人情感色彩的文本信息,如果能够从这些数据中分析出潜在的用户情感信息,那么将会具有巨大的科研价值和实用价值。传统的文本情感分析主要是基于篇章和句子级别的,对含有多种
学位
肝肿瘤热消融治疗已用于临床,该治疗是在医学影像的引导下,将消融针经皮刺入肝肿瘤作为热源,在数分钟内将肝肿瘤加热至高温形成完全凝固性坏死,从而在原位灭杀肿瘤。客观准确的将消融针经皮介入至肝肿瘤是热消融治疗的重要环节,然而目前临床上该环节仍然依赖临床医生的个人经验。近年来,计算机辅助手术导航系统成为肿瘤消融领域的研究热点。手术导航系统经过空间配准后可以在术中跟踪手术器械,并将其位置在影像系统中以虚拟探
学位
随着高分辨率遥感对地观测技术的迅猛发展,遥感图像数据量呈现指数倍的增长,如何从海量的遥感图像数据中快速浏览和高效检索到所需的图像,已经成为遥感图像信息提取和共享的瓶颈和难题,是发挥遥感数据效应的关键所在。高分辨率遥感图像检索目前大多采用基于内容的图像检索(Content based Image Retrieval,CBIR)框架,CBIR包括特征提取和相似性度量两个核心部分,图像内容通过特征来表征
学位
随着科技的飞速发展,在快节奏和高强度的生活状态下,亚健康和慢性病患者的数量增多,另外,社会的发展导致的老龄人口增多也是个不容忽视的问题。慢性病患者与老龄人口有个共性:需要频繁检测身体指标,同时又因为某些客观因素无法做到。而尿液检验作为一种广泛应用的医学诊断手段,对医生确诊病情给予很大帮助。然而,针对上述人群,传统的尿检手段并不能满足其日常检测需要。因此本文基于红外光谱法的基本原理,以朗伯-比尔定律
学位
病理图像分析是实现癌症诊疗的基础,而细胞核分割作为其重要分支,有着举足轻重的地位,在一定程度上,它可以跨越不同患者与不同器官之间的障碍,实现癌症的自动诊断。尽管随着人工智能的发展,基于深度学习的方法可以弥补传统方法的不足,但是由于细胞核在病理图像中所呈现的聚集状态,病理图像细胞核分割仍然面临挑战。首先,本文阐述了病理图像细胞核分割的研究背景和意义,回顾了国内外研究现状,分析现有方法的优势与不足,明
学位
基于中间品跨境生产活动为主要特征的全球价值链贸易已成为当今世界经济与贸易发展的主流,而贸易壁垒导致的贸易摩擦将严重影响中国制造业深度参与全球价值链以及从价值链中通过技术扩散效应吸收外国的先进技术。在此背景下,本文以问题为导向,借鉴传统的创新驱动经济增长理论与技术扩散理论,对经典的国际贸易技术扩散模型进行应用、修正与扩展,重点审视与考虑全球价值链背景下中国进口贸易的技术扩散效应,并进一步揭示关税壁垒
学位
患有主动脉瓣脱垂(aortic valve prolapse,AVP)的患儿行主动脉瓣单叶置换(Single valve replacement,SVR)术后,置换瓣叶与自体瓣叶材料不匹配,可能对瓣叶运动同步性造成影响,且随着年龄的增长可能出现主动脉瓣关闭不全(Aortic valve insufficiency,AI)和主动脉瓣狭窄(Aortic stenosis,AS)的现象。本课题利用数值模
学位
延迟偏微分方程广泛应用于经济学、物理学、生态学、生物系统、医药学、流行病学、工程控制、计算机辅助设计、核工程、气候模型等,受到了越来越多的关注.求解延迟偏微分方程的高精度近似解是非常有意义的,因此,数值解法的研究对于求解此类问题尤为重要.本课题的研究对象是延迟偏微分方程中重要的一类:抛物型延迟对流-扩散-反应方程.本文提出并分析了具有Dirichlet边界条件的非线性延迟对流-扩散-反应方程的ET
学位
智能电动汽车和储能电站的快速发展对锂离子电池的能量密度及功率密度提出了进一步的要求,而开发出新型高比容量的正极材料是提高锂离子电池能量密度的关键。富锂正极材料由于较高的比容量,被视为新一代正极材料的理想之选。然而,还有许多问题限制了这类材料的商业化应用,包括首效低,循环稳定性差,倍率性能差等。在本论文中,将成本更低,环境更为友好的富锂铁锰正极材料作为研究对象,围绕如何合成结构更稳定,性能更好的富锂
学位
高黏度/高固含体系的特种分离浓缩是分离领域的难点。管式膜有流道宽、不易堵塞等特点,适用于高黏度/高固含体系。但是,自支撑有机管式膜的制备研究存在诸多挑战,其难点在于膜管的自支撑性取决于管壁的相对厚度,膜管越粗,要求壁厚越大,纺丝挤出的膜液越多,这会延迟成膜速率,从而对制膜设备的要求提高了。同时,壁厚增大会降低膜通量,要提高膜通量就需要优化膜结构。这些问题都使得自支撑管式膜的制备极具有挑战性。聚砜(
学位