论文部分内容阅读
随着我国互联网技术的快速发展,电子商务水平的不断进步,消费者的购物方式也由原本的线下购物向线上购物转移。这为消费者带来便利的同时,也产生一些问题,由于消费者在线上购物时无法接触到实物,因此仅能从其他消费者所发表的评价中获取产品质量及商家服务等相关信息从而制定购买决策。然而评论数据的内容繁多,消费者关注哪些信息,评论中的信息又会对产品的销量产生怎样的影响。为探究这一问题,本文将对电商平台中的消费者的评论内容进行分析研究。通过知网数据库对以往学者的相关研究进行整理,发现现有对评论数据的搜集多集中在对产品的初次评论方面,对追加评论的研究相对较少,且研究的对象多集中在电子设备、服装、团购、旅游等领域,对农产品领域的研究相对较少。因此,本文以生鲜产品为研究对象,以生鲜水果为例,通过对JD平台评论数据的收集及分析,探讨初次评论及追加评论是否会对生鲜产品销量产生影响并各项指标影响的强弱程度,结合生鲜产品的特性构建相对应的研究体系,同时也为今后农产品的研究提供一定的理论经验,并根据分析的结果对生鲜电商了解消费者需求制定营销策略,并最终提高生鲜产品的销量提供相应的意见及建议。本文运用python3.6编写程序代码并从选定的范围内爬取JD平台的生鲜水果的评论内容,然后对爬取的数据进行清洗,删除重复的评论、消费者未评价的评论以及广告的评论,随后用运用jieba模块对评论的文本内容进行分词处理,通过建立停用词表的方式剔除无意义的词语,并通过词频计算的方法提取出消费者较为关注的会对生鲜产品销量产生影响的特征,对提取的特征进行tf-idf计算得出各特征词的权重,了解消费者对各特征的关注程度。通过snownlp计算初次评论及追加评论的得分情况;随后对爬取的评论数据进行进一步统计整理,根据变量提出相应的假设,建立模型,运用多元逐步回归的方法对提出的假设进行验证,并比较各项指标对生鲜产品销量影响的强弱程度。通过上述分析,得出消费者对生鲜电商所提供得物流、价格、包装、品质、服务情况最为关注,且现今消费者对生鲜产品的价格及服务情况的满意度最高,对包装的满意度最低。通过对JD生鲜产品初次评论及追加评论的数据处理及多元逐步回归分析发现本文所选取的变量中的初次评论及追加评论的情感倾向、初次评论的评论深度及评论的追评率皆会对生鲜产品的销量产生影响,而所选取变量中的追加评论的评论深度、评论的极端性及初次评论及追加评论的时间间隔不会对生鲜产品的销量产生影响。通过对回归结果的进一步分析比较得出初次评论的情感倾向对生鲜销量的影响要大于追加评论对生鲜农产品销量的影响。根据评论文本分析中获取的消费者各特征关注情况,对生鲜电商提出提高物流服务质量、保证生鲜产品品质、改善产品包装方式等建议以提高消费者对生鲜电商的整体满意度;根据回归分析结果,提出生鲜电商平台应强化平台的监管服务及完善生效平台评论区的建设,保证消费者能够在评论区快速的浏览到有用的评论信息以帮助消费者制定购买决策进而提高生鲜电商的产品销量,促进生鲜电商的可持续性发展。