基于客户评论的电商热水器数据分析与挖掘

来源 :理论观察 | 被引量 : 0次 | 上传用户:aote_jeanny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文围绕电商平台中热水器的市场现状及发展趋势进行调研分析,以电商客户评论及百度指数、阿里指数等数据分享平台上相关信息为数据源,采用一系列数据挖掘分析方法对客户在电商平台购买热水器的行为特征进行分析,最终构建用户购买决策属性评价体系,并以此为依据对电商提出切实可行的改进建议,使其产品与客户需求的发展趋于一致,从而使二者达到双赢。
  关键词:热水器;电商;属性评价;数据挖掘
  中图分类号:F724.6,TP311.13 文献标识码:A 文章编号:1009 — 2234(2017)11 — 0098 — 03
  1.引言
  随着电子商务的蓬勃发展,国内电商市场上的产品质量参差不齐,即便是各大电子商务巨头如京东、淘宝等,依然各有优劣。对客户而言,虽然选择增加了,但选择购买产品时更须慎重;对商家而言,客户的需求即市场,但客户的真正需求是什么,却需要认真探索。本文围绕电商市场中的热水器开展调研,利用中文分词、数据挖掘与情感分析等技术,通过对各大电商平台上消费者的评论进行数据预处理、中文分词、词频统计、分类聚类四项操作,最终提取出关键词并进行整合分析。再结合百度指数、阿里指数,采用舆情分析中的情感分析方法对搜索引擎上的相关词、搜索指数、上升频率等数据进行统计,旨在得出客户对电商市场上热水器的关注点,客户做购买决策时对属性的分析、侧重及选择的流程以及评价体系。从而对商家提出确切的改进建议,使其前进方向与客户需求趋于一致,最终达到双赢。
  相对于传统的商务活动而言,电商对于客户情感的把握主要来源于两方面:一是搜索浏览记录;二是商品评论。前者主要是网络用户购买前搜集信息以及对产品的初级认知,也表现了该商品或服务在社会上的热度及舆情评价,本文通过对百度指数等搜索引擎上关键词的相关数据进行分析〔1〕。而后者大多是客户购买后对购买及使用过程的评价,对其进行数据挖掘不仅可获知客户对商品或服务的具体偏好,又能获得客户提出的问题及改进方向〔2〕。
  本文应用网络用户情感分析方法,情感分析(Sentiment Analysis)又称情感分类(Sentiment Classification)、评论挖掘(Review Mining)或意见挖掘(Opinion Mining),是指通过自动分析商品、服务、人物等研究对象的相关评论文本内容,发现评论者对该研究对象的褒贬态度和意见〔3-4〕。客户对于评论对象的态度大致可分为三种:正面、负面、中性。而基于情感倾向方面,本文同大多数研究一样使用正面、负面这两类情感来区分客户的偏好〔4〕。对比美国学者提出的客户细分理论,本文研究的是属性细分,即大多数客户对同一产品和服务不同属性的偏好,从而在每一属性上为电商提供改进方法,使之更加符合客户的需求〔5〕。
  2.研究设计
  本次调研分三步进行。首先对国美电商平台上不同品牌(海尔、美的、康宝、万家乐)的客户评论进行特征提取、分类聚类、词频统计等处理,提取出客户评论中与热水器相关的关键词,并利用舆情分析中的情感分析与SPSS工具统计客户提出的问题及其属性分类、重要程度。继而对百度指数、阿里指数等数据分享平台中的相关检索词进行统计,对属性分类及内容进行补充,并研究其发展趋势。最后对各属性进行评分评级,构建客户购买决策流程及属性评价体系,并针对每项问题提出相关改进建议。
  3.热水器关键词及属性分析
  3.1电商平台客户评论词频统计分析
  通过对客户评论进行数据挖掘,利用中文分词与词频统计技术对该数据集进行预处理后得到关键词数据集,其中重点关键词的排布如图1。
  图1 客户评论关键词比重分布图
  由图1可知,“安装”的比重达到46%,“服务”、“物流”等关键词的比重较高,结合原评论可知由于热水器属于大型家电,运输及安装都十分不便,故而客户反映较多的是此两点。
  将以上关键词进行分类和聚类处理,可得客户对产品的关注点:服务(包括客服、运输、安装、售后维修等)、外观(漂亮、大气等)、性能(加热等)、质量(问题、品质等)、价格、品牌。进一步对关键词的词性进行分类,利用用户情感分析方法,提取出客户对不同产品的具体好评与差评词汇。以品牌为第一维度、以其他关注点为第二维度,由差评词汇统计可知,客户的差评主要集中在物流慢、安装费高、加热慢、水很烫、耗电高、缺少配件或配件贵、产品降价快等方面。其中加热、保温、功率等因素属于产品本身性能的问题,而差评中比重较大的安装、物流、配件等服务问题及降价的价格问题,则属于销售商的营销问题。
  3.2热水器百度指数关键词
  根据百度指数检索词的相关度排布,按来源检索词与去向检索词进行分类叠加,进行统计后可知,百度中文搜索引擎中与“热水器”相关的检索词按相关度由大到小依次为“燃气”、“热水器品牌排行榜”、“电热水器”、“太陽能热水器”、“空气能热水器”、“海尔”、“热水器安装”、“即热式热水器”等。进行聚类后可知检索词主要分为四类:热水器类型(根据使用能源分类)如“燃气热水器”、“太阳能热水器”、“空气能热水器”;热水器品牌及排行:主要有海尔;热水器安装;即热式热水器。
  结合重点检索词搜索指数排行:海尔(13019)、品牌(4188)、空气能热水器(3706)、燃气热水器(3185)、太阳能热水器(2890)、电热水器(2134)、史密斯热水器(1967)等,可知普通客户在对产品不了解时会寻求网络的帮助,作为购买决策者第一步是参考产品的品牌排行,海尔作为全球家电的第一品牌在知名度与质量口碑上自然有所优势;其次是使用能源类型,随着新能源家电的普及,原本的燃气热水器、电热水器市场蛋糕已逐渐被新能源热水器分走;最后售后安装等问题也是客户关注的重点。此外,即热式热水器凭借其即开即热的优势在热水器市场上已逐渐获得关注。   3.3属性分析
  通过分类和聚类,将客户评论及百度指数、阿里指数中的关键词分为八大属性:价格、性能、服务、质量、外观、品牌、客户及其他属性。根据各属性中关键词的词频比重,可得出客户在电商平台购买热水器时所关注的主要指标及相应指数,如图2。
  图2 热水器属性雷达图
  由图2可知,电商平台中热水器交易参照属性由大到小依次为:性能、品牌、价格、服务、外观、质量、客户、其他。具体分析来看,性能属性主要包括加热功能、能耗、控制三个方面。此外,通过对淘宝所售热水器品牌关键词的统计分析,可知当下最受欢迎的热水器品牌为美的、史密斯、海尔,结合相关资料,可知自2011年至2015年最受关注的热水器品牌同样为此三家,故而判定在产品品牌上客户的选择变化不大。其他属性如客户购买渠道、产品产地货源等,由阿里指数可知厂家直销采购指数超过15000,产地货源问题采购指数也达到14553,可见客户在做决策时会在这些因素上做相应关注。
  4.电商热水器发展趋势分析
  4.1百度检索词相关性变化趋势
  图3 百度相关检索词变化趋势
  根据百度指数与热水器相关检索词一年来(2016年7月至2017年6月)的相关性强弱绘制趋势图可知,“电热水器”、“燃气热水器”、“热水器品牌排行榜”等检索词始终保持强相关性,而“速热式电热水器”、“即热式热水器”等检索词曾保持高相关性,但近几个月其关注度已逐渐下滑。究其原因,即热式电热水器虽然有加热快、节能、方便等优势,但由于其功率过大,不能与大多数家电同时使用,且容易出现安全事故,故而客户使用的少,一般的品牌也不会去生产,市场上较为常见的是海尔和史密斯。观察海尔和史密斯的变化趋势可知,海尔在热水器乃至家电市场上始终保持龙头地位,史密斯紧随其后,美的、万和等品牌也曾出现在弱相关范围内,但不能长期保持。其他检索词涉及的使用能源类型、安装等方面虽相关性不高,但能持续保持一定的关注度,可见此类原因虽然不是客户在电商平台上选择热水器的决定条件,也是充分条件。
  4.2百度搜索指数变化率
  通过计算中心词“热水器”所有相关词中搜索指数变化率上升速度排名可知,除上述重点相关词外,客户在购买使用热水器后产生并关注的问题,诸如“热水器打不着火”、“排污口”、“维修”、“尺寸”等,其关注度正在逐渐上升。
  5.结论及改进建议
  结合客户评论关键词与各指数的分析结果,建立购买决策属性评价体系根据模糊综合评价法对热水器八大评价属性进行分级,可分为重点属性、普通属性、参考属性三个级别。已知每个属性分别对应各自的一级、二级、三级属性,对最低级属性进行评分,以各属性关键词词频统计及指数分析为依据进行赋值。分析各属性所代表的主要问题及现状,并针对每条现状提出切实可行的改良建议。
  5.1重点属性
  重点属性属于客户在购买前后重点参考的属性,对用户购买决策影响重大,是电商重点考虑且急需改进的属性,包括性能和品牌等一级属性。
  (1)性能(10分):包括功率、能源、控制等二级属性。
  功率:问题主要表现在普通式热水器功率低、加热慢且耗电,但即热式热水器虽然功率高省电,却因大功率使用麻烦。对此改良建议为:有实力的企业如海尔,可继续开发即热式热水器,普通品牌企业继续生产普通热水器。
  能源:目前热水器使用的主要能源依然是燃气,但新能源如空气能、太阳能等也在崛起。大企业如海尔,建议加大开发新能源热水器的步伐。
  控制:包括水温(加热时水温过高、保温效果差)、水流量较小、遥控差的问题,建议开发商利用热敏、保温效果好的材料进行改良。
  (2)品牌(8分):品牌主要表现在客户在购买前搜索热水器排名的现象上,通常排名越高被选择的可能性越大,如海尔、史密斯、美的等。建议各企业注意品牌的宣传,在广告、各大搜索引擎等营销方式上加大投入。
  5.2普通属性
  用户虽有考虑却没有决定性影响的属性,普通属性涉及的问题不是必须改进的,但改进后对于电商及厂商的发展有一定的促进作用,属于锦上添花类,包括價格、服务、外观、质量配备等一级属性。
  (1)价格(7分):通过调查,价格区间在1803~3216元之间的购买客户最多,建议电商选择合适的客户群,适当调整价格。
  (2)服务(6分):主要表现在安装、物流、维修、客服态度等二级属性上,建议提供售后物流、安装、维修服务,注意客服人员态度。
  (3)外观(5.5分):主要表现在颜色与尺寸,通常最受欢迎的是40L、白色热水器。
  (4)质量配备(5分):质量问题为打不着火,其他如无配件或配件贵、排污口位置不易发现等问题。建议提供价格合适、质量保证的配件,以及详细的使用说明书。
  5.3参考属性
  相对于前两者而言参考属性的关注点不在产品或服务本身,而在于产品来源和去向的侧面影响,仅作为重点和普通属性的参考,包括客户和其他属性。
  (1)客户(4分):作为产品的去向,客户的年龄、性别、收入等属性都会影响其偏好及决策,经分析,目标客户多为30~49岁、收入中等的中年男性,占据了66%的比重,厂商可根据客户特征在价格、外观上综合调控。
  (2)其他(3分):如购买渠道,已知客户偏好为厂家直销的方式,厂家可适当调整销售渠道比例。
  〔参 考 文 献〕
  〔1〕陈劲松,何会玲.电子商务对消费者购买行为的影响分析〔J〕.中国管理信息化综合版.2006,
  (10).
  〔2〕黄萱菁,张奇,吴苑斌.文本情感倾向分析〔J〕.中文信息学报.2011,(06).
  〔3〕张紫琼,叶强,李一军.互联网商品评论情感分析研究综述〔J〕.管理科学学报.2010,(06).
  〔4〕徐健.基于网络用户情感分析的预测方法研究. 中国图书馆学报,2013,(03).
  〔5〕刘秀芹.基于Web挖掘的B2C网站需求分析与应用研究〔D〕.天津大学,2009.
  〔责任编辑:孙玉婷〕
其他文献
摘要:文化反哺现象的不断发展,影响着技校宪法教育的教学思维进路。针对维权意识强烈但守法意识缺失的技校生对宪法的不同态度这一现象,具备引导学生掌握知识原理,提升他们的思维能力和培养其宪法意识的案例素材是增进学生对宪法的认同并转化为正确守法行动的有力手段。本文主要通过探讨案例的甄选与适用,旨在完善宪法认同教育的问题。全文共分四个部分:第一部分阐述文化反哺下的技校宪法认同教育内涵;第二部分分析宪法教育案
公办高校实行党委领导下的校长负责制,这是建国以来我国高校领导体制改革的正确选择,在新的历史条件下,必须进一步发挥高校党委的作用,不断加强和完善党对高校的领导。高校党
进贤县地处江西省中部,鄱阳湖南岸,属南昌市郊区县。境内气候温和、雨量充沛、交通便捷、农业资源丰富、养殖历史悠久,是江西省的畜牧业大县。近年来,进贤县在县委、县政府的
目标的不确定或不一致是很多企业在进行绩效评价时经常产生的困惑。举一个发生在生产门窗框的加工业企业中高级管理层发生的真实对话:总经理让管理层讨论一下公司怎样才能更好
祁连雪白千峰秀,塞上草青万马腾。具有两千多年历史的甘肃中牧山丹马场,自汉朝起即为皇家马场,官牧之地。解放后养马业常兴不衰,牛羊畜牧业也迅速崛起,初步形成以马匹改良繁育为主
2008年法库县地税局以"基础年"建设为契机,围绕个体税收管理的热点、难点问题,突出抓好"四点",确保了个体税收管理工作的有效开展。一是狠抓焦点。全面实施政务公开,将纳税人普遍关心
8月17日,商务部召开例行发布会。发言人表示,最近,商务部会同海关总署发布公告,准备把鲜奶、奶粉的进口纳入自动进口许可管理。今年上半年,我国进口乳制品同比增长了84%,增幅比较高
本文主要研究影响天津市地铁2号线沿线房地产价格差异的因素,首先通过市场调研和借鉴前人经验,选取了11个特征变量指标,然后采用Hedonic模型进一步筛选出6个对房地产价格起显
2008年11月23日,浙江省缙云县某羊场的山羊,因腹泻使用头孢噻肟、青霉素等多种抗菌药物,久治无效,先后死羔羊13头。经剖检与实验室诊断,本次疫病的主要致病原因是血矛线虫和