电商数据的挖掘分析与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:kupanda09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅速发展,网上购物变得越来越频繁,各电商平台每天都会产生大量的交易数据和用户评论数据,这些交易数据和用户评价数据对于企业来说具有着巨大的价值。因此,本文主要通过爬虫方式从电商平台来获取公开企业外部数据,并从采集、清洗、分析和应用等各个环节来进行研究,并以天猫平台的吸尘器品类为例子来做分析应用研究。本文通过火车头采集器进行天猫平台吸尘器相关数据的采集。由于采集的天猫数据存在不规范性,所以需要对采集的数据进行清洗和规整,规整后的数据如何进行分析和落地应用一直都是企业面临的一个大的问题,值得我们深入分析和研究。本文主要运用了描述性统计分析、对比分析、prophet时间系列预测分析、K-means聚类分析和基于词典的文本分析方法。在行业市场分析和品牌竞争分析中主要用了描述性统计分析和对比分析,得到行业各细分吸尘器的市场占比、同比增速、价格和属性表现等,也知道各品牌的主销品类和价格段分布。Prophet模型应用在吸尘器销额的趋势预测上,通过参数寻优的方法找到各细分品类的最优参数并进行预测。各细分品类的预测误差率都在10%以内,预测效果较好。预测得到无线手持吸尘器的销额趋势较好,而卧式吸尘器有下降趋势。在K-means品牌聚类分析中,得到了4了类别,分别是高销额的综合性品牌类、高单价的扫地机器人品牌类、高单价的无线手持吸尘器品牌类和低单价的综合性品牌类。品牌聚类的目的是把相似的品牌归到一起,找到真正的竞争对手来做竞争分析,找出优势和不足。在用户评价的文本分析中,主要构建了以购买体验、产品体验和服务体验三个方面的评论分析指标体系以及关键词语料库。通过基于关键词语料库去匹配和分析用户评价,分析用户的关注点和情感态度。得到用户关注最多的是产品体验,同时产品体验的负面占比也是最高的。用户关注较多的二级指标有噪音、使用感受、吸力、质量、价格和物流。此外,在美的和海尔的对比上,我们得到美的在噪音和质量上好于海尔,而海尔在使用感受、吸力和价格上好于美的。通过对外部行业数据和竞争对手的数据分析,能让我们了解到行业发展趋势、品牌竞争格局和用户的关注点和吐槽点,更好的认识自己的优势和不足,做到知己知彼,并以用户为中心来改善产品和服务。
其他文献
农村中的非政府组织在社会转型、文化重构的过程中有其特殊性,为了有效进行管理,必须兼顾它的“礼俗性”和“理性”的双重特点。
住宅的市场定位,就是房地产开发商在项目策划之初确定其开发住宅的目标消费阶层和目标消费群体的过程.通俗地讲,就是"开发出来的住宅卖给谁"的问题,即对所开发住宅的买者、规
商业地产抵押贷款支持证券,即CMBS,是资产证券化的一种,是创新的融资方式,它能够盘活存量资产、丰富企业融资渠道,降低企业融资成本,正是在商业地产融资受限、受电商打击的形势下与其需求相匹配的创新产品。但由于其在我国发展较晚,发行经验不足,因此其发展存在一定风险问题。本文通过研究代表性案例,我国CMBS首单违约案例——红博会展信托受益权资产支持专项计划,希望能丰富我国CMBS的研究。本文基于预期收入
无形资产是企业资产的重要组成部分,也是会计核算的重要内容之一。随着日益深化的国际惯例引入,会计无形资产的核算日益显得重要。继会计改革风暴之岳,无形资产在企业中的地往越
近年来,全球经济一体化的发展带来了企业间的竞争趋势的不断加剧。随着电子商务行业的发展,电子商务企业的数量也在增加。价值链成本管理,摆脱了传统成本管理的局限性,将成本管理理论与价值链理论结合起来,为电子商务企业进行有效成本管理开辟了新途径,在目前的竞争环境下,能够最大限度地满足电商企业价值链各个环节的增值需求。本文选取电子商务行业为研究对象,以电子商务行业中的M公司作为电商企业代表,以2017年至2
近年来,机器人领域发展迅速,特别是移动机器人应用越来越广泛,其中移动机器人导航技术的发展也是突飞猛进,基于视觉传感器的导航算法更是层出不穷。特别是,深度强化学习在某
近年来,河南省文化产业发展迅速,成效显著,但受经济发展形势及文化产业发展模式的影响,发展过程中存在总量偏小、基础薄弱,地区不均、结构失衡,人才不足、消费乏力等问题。在大力发
目的通过比较参术止泻散与小儿止泻安颗粒治疗小儿脾虚泻,观察两种药物的治疗效果,明确参术止泻散的疗效,为临床应用提供帮助。方法85例脾虚泻患儿均来自保定市第一中医院儿