基于词库匹配方法的电商商品评论的分类及情感分析

来源 :深圳大学 | 被引量 : 0次 | 上传用户:bigxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,随着互联网的不断发展,网上购物越来越成为人们生活不可缺少的一部分。据艾瑞网最新统计的数据显示,2019年中国电商行业交易规模达31.63万亿元,同比增长16.2%。网上购物的逐渐成熟使得消费者越来越关注购物过程中的服务体验,相对于实体销售而言,网上购物中的买卖双方缺乏面对面获取影响销售的环境,电商评论是一种重要的网络口碑形式,是网上购物为买卖双方增进相互了解的一种互动弥补方式。消费者可通过查阅已有评论来了解产品的好坏。由于买卖双方具有获取信息方面的不对称性,因此为了减少购物的风险,越来越多的消费者在购物之前选择参考已有的电商评论。由于电商发展的日益壮大,电商评论的数量也越来越多,利用单纯的人工操作无法满足商家和消费者对大量评论数据有价值信息获取。因此本文需要对大量的电商评论进行分析和处理,来帮助商家改进电商的服务以及提高消费者的购物体验。主要的研究工作有:(1)对比不同电商平台的性质,选取京东电商平台上的商品评论作为数据爬取的对象。对比不同爬虫工具的优缺点,选择使用Python中的Requests+Beautiful Soup组合爬虫工具进行数据采集。接着对获取的评论数据进行文本的预处理工作,主要包括文中文分词、去停用词等,为后续电商评论数据的分类和情感分析做数据的准备。(2)对比文本分类方法的优缺点选择统计学习法对数据进行分类。选取分类方法之后对比该分类方法所需要用到的模型的优缺点,选择使用BP神经网络模型对评论数据进行分类。词库的建立是评论数据分类过程中非常重要的一环,本文进一步阐述了词库建立的方法和步骤。利用词库可以将评论数据转化为BP神经网络模型的特征输入对模型进行训练。利用训练好的模型实现对相评论数据的分类并对比不同专家的分类结果,对比准确率均为90%以上。(3)对比情感分析方法的优缺点选择基于情感词典的情感分析方法。叙述情感分析的整个流程,将分类好的数据进行情感分析,并对分析结果进行统计。最后将统计结果对比不同专家的统计结果,对比准确率均为90%以上。(4)将评论数据分类和情感分析的方法相结合,并对京东电商平台的宏观时间数据和微观时间数据的物流因素满意度差异进行分析。宏观时间数据对比分析结果中2019年整体物流满意度较2018年上升6.27%,并且各个方面的物流因素满意度均有提高,但是快递员送货态度方面有待改善。另一方面,微观时间数据对比分析结果中特殊时间段的物流因素整体满意度则均有所下降。通过对比不同时期的物流因素满意度差异,给商家提供相应的改善建议,使商家有针对性的改善电商服务,具有一定的理论和实践意义。
其他文献
本论文以辛亥革命前后中国社会思潮与长三角地区戏剧市场的关系为研究对象,旨在以从艺术史的角度,探索近代历史转折期中国社会思潮与戏剧的互动关系。在结构上,本论文共分为五个部分。第一个部分是绪论;第二个部分着重探讨辛亥革命前后以国粹主义、无政府主义与革命主义为代表的三种主要中国社会思潮的生成、传播与演进情况;第三个部分以京剧、昆曲两大剧种的演出市场为例,探讨辛亥前后长三角地区的戏剧市场总体状况;第四个部
近年来随着我国各地高校扩招政策的实施,在校大学生日益增多。宿舍作为他们主要生活和学习的场所之一,其健康环境条件需要特别重视。然而目前大量的既有宿舍存在许多影响大学生身心健康的环境问题,比如室内空气环境恶劣、居住体验感差、隔音效果不好和人员交互关系淡薄等。相关学者对这种现状改善的研究主要集中在建筑本身的构造和性能上即所谓的绿色建筑,或是独立分析宿舍社区主体交互关系的状况,并未从宏观及微观各个角度综合
随着全球工业信息化与智能化的不断发展,智能机器设备逐渐替代人工生产,使得机械设备的可靠性和服役寿命面临巨大挑战,促使设备故障诊断与健康管理技术面临更高需求。其中,以摩擦副磨损的直接产物—磨粒作为研究对象的铁谱分析技术可获取宏观磨损量和微观磨损机理信息,为机械设备磨损状态分析提供重要依据,已经成为重大机械设备健康状态监测的重要手段。本文针对铁谱图像分割和磨粒识别方法存在周期性长、效率低等问题,提出基
随着大数据与人工智能等新技术的发展,将大数据挖掘技术与教育行业相结合以提高学校智慧管理水平的方法日益受到关注与重视。目前,各大高校校园建设已经从数字化校园建设时代步入智慧校园建设时代。高校开始逐步地对已建设的校园一卡通系统、教务系统等校园应用系统进行整合,并对所采集的各大应用系统的历史数据进行挖掘分析,从中提取隐藏的数据价值,以进一步提升学校的服务管理水平。基于此背景,本文以来自各大应用系统的校园
随着信息技术和人类生产生活深度融合、互联网快速普及,全球数据呈现爆发增长、信息爆炸问题日趋严重,以个性化推荐为代表的大数据挖掘技术正在成为解决信息过载的重要工具。图书馆是高校中的“知识海洋”,为全校师生提供图书借阅、文献检索及科研支持等服务。在传统的借阅方式中,师生产生图书借阅行为源于学习需求及兴趣爱好,图书以一种被动的方式被借阅。在这种借阅形式中,读者会面对以下两个问题:一是在数以百万计(国内部
PDC材料传感器又称为聚合物衍生陶瓷传感器,是一种无线无源的温度传感器,其特点是耐高温、耐腐蚀,主要应用在恶劣条件下的高温测量。此传感器内部有一个谐振腔,当自身温度发生变化时其内部谐振腔的谐振频率也会产生相应的变化,且这种变化与温度的改变成负相关关系。基于传感器的这种特性,可向其发送固定频段的恒定幅值扫频信号,同时采集和分析传感器反射回来的回波信号,从而得出其谐振频率进而找到对应的温度值。本文研究
工业与居住用地作为工业化和城市化的主要物质载体,为经济发展和社会进步提供了有力的支持。但随着土地资源的日益稀缺,单纯依靠工业与居住用地规模扩张来拉动经济增长已经不可持续,如何合理规划两类用地1供应规模,并在二者供应总规模限定不变的情况下,优化调节两类用地配置比例,促进中国经济可持续增长。另外,不同城市资源禀赋、产业结构以及发展方式各异,需要因地制宜地制定土地供应政策来支撑城市经济增长。基于以上思考
土地承载城市各类社会经济活动,因其资源稀缺性和供给有限性,利用土地需集约节约,实现高效。由于各城市土地资源禀赋、规模、定位等不同,导致城市内部各类土地配比呈现异质性。因此,如何因地制宜结合城市发展模式进行土地配比动态调节研究,实现城市土地合理高效利用,该问题值得探讨。通过递进式梳理关于“土地利用结构优化”的文献后发现,相关研究较丰富且较成熟,但国内外学者对此类问题的关注重点存在差异。就“城市土地配
“十三五”期间我国经济保持稳定增长,伴随着经济的增长和产业结构的调整,现代物流行业对于区域经济的发展,提高区域经济整体竞争力,所发挥出来的作用越来越凸显。从宏观产业经济发展的角度来看,各种区域物流发展政策的制定、区域物流设施的规划与设计以及产业布局都离不开对区域物流需求进行定量分析。因此,对区域进行物流需求预测是一项基础性且必要性的工作。通过对区域物流需求进行定量分析,有助于地区物流经济主管部门制
本文旨在从艺术学理论的视角研究当代电子游戏,阐释电子游戏在满足人们追求自由的同时还丰富着人类的审美心理和情感体验。分别从电子游戏的视听元素、时空构造、自我展示等维度考察电子游戏的审美特性,并结合相关电子游戏案例,将电子游戏置于学理层面,客观、全面地认识电子游戏的艺术特征,促进电子游戏在艺术性与商业性之间的平衡发展。本文分别从以下四个方面阐述电子游戏的艺术性。首先从艺术起源与游戏的角度来看,艺术活动