论文部分内容阅读
随着电子商务的迅速发展,网上购物变得越来越频繁,各电商平台每天都会产生大量的交易数据和用户评论数据,这些交易数据和用户评价数据对于企业来说具有着巨大的价值。因此,本文主要通过爬虫方式从电商平台来获取公开企业外部数据,并从采集、清洗、分析和应用等各个环节来进行研究,并以天猫平台的吸尘器品类为例子来做分析应用研究。本文通过火车头采集器进行天猫平台吸尘器相关数据的采集。由于采集的天猫数据存在不规范性,所以需要对采集的数据进行清洗和规整,规整后的数据如何进行分析和落地应用一直都是企业面临的一个大的问题,值得我们深入分析和研究。本文主要运用了描述性统计分析、对比分析、prophet时间系列预测分析、K-means聚类分析和基于词典的文本分析方法。在行业市场分析和品牌竞争分析中主要用了描述性统计分析和对比分析,得到行业各细分吸尘器的市场占比、同比增速、价格和属性表现等,也知道各品牌的主销品类和价格段分布。Prophet模型应用在吸尘器销额的趋势预测上,通过参数寻优的方法找到各细分品类的最优参数并进行预测。各细分品类的预测误差率都在10%以内,预测效果较好。预测得到无线手持吸尘器的销额趋势较好,而卧式吸尘器有下降趋势。在K-means品牌聚类分析中,得到了4了类别,分别是高销额的综合性品牌类、高单价的扫地机器人品牌类、高单价的无线手持吸尘器品牌类和低单价的综合性品牌类。品牌聚类的目的是把相似的品牌归到一起,找到真正的竞争对手来做竞争分析,找出优势和不足。在用户评价的文本分析中,主要构建了以购买体验、产品体验和服务体验三个方面的评论分析指标体系以及关键词语料库。通过基于关键词语料库去匹配和分析用户评价,分析用户的关注点和情感态度。得到用户关注最多的是产品体验,同时产品体验的负面占比也是最高的。用户关注较多的二级指标有噪音、使用感受、吸力、质量、价格和物流。此外,在美的和海尔的对比上,我们得到美的在噪音和质量上好于海尔,而海尔在使用感受、吸力和价格上好于美的。通过对外部行业数据和竞争对手的数据分析,能让我们了解到行业发展趋势、品牌竞争格局和用户的关注点和吐槽点,更好的认识自己的优势和不足,做到知己知彼,并以用户为中心来改善产品和服务。