论文部分内容阅读
摘 要:为进一步探究和分析电子商务客户关系,本文提出e价值的指标体系和计算方法,同时基于使用k-means方法对客户进行分类,实现对客户关系的深层发掘。基于改进的RFM模型实现了对客户的辨别与分类功能,对不同客户的e价值能进行有效预测,同时可以为企业在电商相关领域营销策略的差异化实施提供依据。对客户关系进行深层细分。同时基于AdaBoost分类器,提出以C5.0决策树作为基分类器的客户保持与流失预测模型,降低错误预测成本,精准识别高价值客户。
关键词:RFM;AdaBoost;电子商务;客户价值
中图分类号:TP391. 41 文献标识码:A DOI:10.3969/j.issn.1003-6970.2021.03.001
本文著录格式:陈俊龙,吴丽丽.基于RFME模型和AdaBoost分类器的电子商务客户关系研究[J].软件,2021,42(03):001-007
Research on E-commerce Customer Relationship Based on RFME Model and AdaBoost Classifier
CHEN Junlong, WU Lili
(College of Information Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070)
【Abstract】:In order to further explore and analyze the relationship between e-commerce customers, this article proposes an index system and calculation method for e-value, and at the same time classifies customers based on the use of k-means method to realize in-depth exploration of customer relationships. Based on the improved RFM model, the function of identifying and categorizing customers is realized, and the e-value of different customers can be effectively predicted. At the same time, it can provide a basis for the differentiated implementation of marketing strategies for companies in the e-commerce-related fields. In-depth segmentation of customer relationships. At the same time, based on the AdaBoost classifier, a customer retention and churn prediction model based on the C5.0 decision tree is proposed to reduce the cost of error prediction and accurately identify high-value customers.
【Key words】:RFM;AdaBoost;E-commerce;customer relationship management
0 引言
在网络技术日新月异的当下,电子商务平台已经深入各行各业中,生活中处处可见电商领域的产品或服务。在社会发展和进步的同时,电子商务区别于以往传统的消费模式,作为全新的形式冲击全国受众的普遍认知,并使其购买行为产生了或多或少的变化。据资料显示,截止2015年,我国互联网用户已逾6亿,到2019年6月,我国网民规模升至8.54亿,手机网民规模达8.47亿,网络普及率超过61.2%。至2020年3月,我国互联网普及率已达到64.5%,网络购物用户规模达7.10亿,近2015年的两倍[1]。
2019年,我国互联网交易规模达10.63万亿元,与繁荣发展的互联网业态相对应,在全新商务模式下,对消费者管理和客户价值认知评估模式也需要推动发展与转型。与传统行业的销售模式相比,在电子商务环境下,消费者的选择空间极度扩大,信息流动迅速,客户留存率大大降低。有研究显示,电商环境下,客户流失率可高达80%,而获取新客户比保持现有客户的成本高得多,与前者相比,客户留存可节约4~6倍获客成本[2]。对电信运营商来说,用户保持率增加5%,即可为运营商带来85%的利润成长。对传统零售行業来说,在电子商务运营中提高复购率,大幅降低营销成本和服务成本,减少高价值客户流失是维持企业在电商领域长期发展的重要途径[3-4]。基于客户关系理论对电商平台现有客户进行关系识别,对高价值客户进行细致的筛选,“因客施策”,着力打造实施精确营销,将成为客户长期留存和价值提升的基础。
现有客户关系研究当中,已有多种算法和工具被运用于相关数据的统计计算及经营决策当中,从传统统计学、统计学习理论,到人工智能、组合分类器及仿生学算法等,机器学习技术逐渐被运用到企业用户管理决策当中。Renjith提出在使用Logistic回归方法深入解离客户流失影响因数的基础上,利用多个属性变量预测流失客户,并通过机器学习方法对不同的方案根据需求进行检索,并根据客户特征进行个性化组合,从而有针对性的提出细分客户留存策略。张秋菊[5]等则构建了基于FRI(自组织模糊规则归纳算法)的客户流失预测模型,通过利用数据分组处理网络(GMDH)对客户流失状态进行判别,测试样本的正确预测可达到90%以上。 为弥补单个分类器在数据预测中产生的效率与性能偏差,近年来,组合分类器被应用到客户流失预测研究中,利用高效协同工作的方式,充分整合各子分类器不同算法的优势,提高集成学习的效率和性能。Schapire提出的Boosting算法和Breiman提出的Bagging算法即是两种常见的集成学习方法,通过训练多个基础模型解决相同问题,获得数个同质弱学习器并进行正确组合,从而获得更好的性能。
Boosting算法思路主要是利用多棵决策树通过组合而形成的,彼此之间通过投票的方式对结果来进行相应的预测。在应用当中,根据分析对象的特征,产生了多种不同的优化组合方案,如在商业银行的客户流失预测中,引入线性判别LDA,对每个数据的统计属性分别计算。
AdaBoost自适应增强算法(adaptive boosting)则在其基础上改变样本的权重。AdaBoost算法在每一次学习之后将重点关注被分类错误的样本,增加分类正确率高模型的权重,有效解决了早期Boosting算法在实际运用中的困难,作为最优秀的Boosting算法之一被广泛使用在实践当中[6-8]。
本文根据电子商务所具有的一些特点,从相关客户对电商平台具有的价值出发,引入“e-value”概念。这一概念从电子销售渠道和服务商的利益角度出发,确定了影响电商客户e价值的关键指标,并结合客户价值评估模型RFM,和k-means方法将客户分类,建立了RFME模型对客户进行识别和分类。本文将提出e-value的处理规则,从而较为准确地对不同客户的e进行估值,为企业在电子商务领域实施差异化营销策略提供了依据。
在此基础上,本文通过以电子商务平台为基础,结合客户消费行为中保持与流失的走向变化,利用CRM理论提出一套预测电商平台客户保持与流失的数理模型。为印证组合模型能对客户流失情况进行更精确的预测,对不同的单一数据挖掘模型和AdaBoost组合模型分别对结果进行预测,并在一定条件下对不同模型的预测结果进行对比,从而来判断不同模型预测的精确度。改进的RFM进一步增强了分类的能力,降低错误预测成本,精准识别高价值客户并采取策略减少客户流失率,为企业电子商务业务降低成本,提高了收益。
1电子商务下的客户关系分析
1.1客户细分
客户细分具有多种角度和维度。依据帕累托原则,企业的核心利润主要由高价值客户创造,这一比例符合广泛存在的二八原则;同时,底部约30%的客户实际上为低价值与无效客户,对这部分客户投入的营销、服务和挽回成本可占到企业利润的50%。因此,有效的对客户价值进行评估和细分,是实现高效客户关系管理(Customer Relationship Management)的基础[10]。客户价值细分有助于帮助企业集中精力,为高价值及有流失可能的客户提供个性化服务与精准营销,是更高效地进行针对性营销活动的重要前提。
本研究中所指客户细分主要指客户价值细分。在电子商务时代,客户消费仍旧是企业获利的直接来源,各电商企业都逐渐由产品中心的经营模式转向用户中心导向,是否能有效进行客户关系维护,挽留流失客户,成为企业是否能保持竞争优势的重要因素。企业依据客户实际价值,对客户进行分类,对高价值客户有针对性地制定相应营销策略,向关键客户进行企业资源倾斜,能够有效提升企业获客和客户挽留的投入产出比,实际上增加利润率,扩大竞争优势,增强企业核心竞争力。这就要求企业首先能够准确对客户价值进行判断和识别。
在网络消费过程中,消费者与企业之间的信息交互呈现即时、双向、周期短的特点,导致客户产生回购的概率大大降低。同时,企业与客户进行沟通时的渠道是否稳定及时并能对问题进行解答,以及企业与客户的供求关系能否长期把持稳定,这些问题需要面临网络信息量大、信息流动速度快、产品同质化程度高、竞争压力大、客户群多样化、差异化程度高等多种挑战。
如何准确在广泛而复杂的客户与潜在客户中,准确识别高价值客户,做好流失预测并及时采取相应策略阻止客户流失,成为电子商务管理和发展人员关注的热点。在众多消费行为相关指标当中,客户消费额度直接与企业产品或服务的质量的销售量相关,并且能够直接作为客户实际价值的量化体现。本研究以客户消费额度为主要显性价值指标,依据历史交易数据进行数据提取,利用RFME模型对客户价值进行量化评估,并完成客户分类。
1.2客户保持与流失
客户流失的企业管理概念是指曾购买或使用过某企业商品或服务的客户,停止在该企业进行消费或合作行为,转而去购买或使用过竞争企业的商品或服务。电子商户客户常常与商家没有契约关系,其消费具有一过性,即在完成一次购买之后,消费者和商家之间的交易行为完成,交易关系终止;直至下一次交易之前,客户与企业之间的关系处在一种非契约关系情境下。
对电子商務运营方来说,识别高价值客户,对其流失概率进行准确预测,在发生客户流失之前进行关系维系和客户挽留,在实际操作层面具有重要意义。而对客户重复购买行为和心理的分析预测,可以帮助企业识别忠诚度更高、复购可能性更大的客户,对其消费行为和购买习惯进行总结和共性分析。围绕客户忠诚度的培养,企业可以根据客户复购决定发生的环节,和消费决策产生的动因等信息,针对性优化其产品、服务与营销手段等,增加留存客户比例,保留高价值客户,降低企业开拓新客户的成本,提升企业对客户的把握能力。
基于电商平台的客户关系推理模型,是结合之前研究结论提出的对电子商务客户关系进行预测的算法模型。它通过追踪统计一段时间内客户在电商渠道发生的浏览、消费等行为信息,对电子商务渠道客户的购买行为进行分析,依照建模细分结果,对不同价值客户进行区别化概率性对待,制定个性化客户保持策略,从而达到平台以更低成本,有效完成客户维持工作。
2基于RFME的客户细分建模 [3] ZHU Bangzhu.E-business customer churn prediction based on integration of SMC,rough sets and least square support vector machine[J].Systems Engineering-Theory & Practice,2010,30(11):1960-1967.
[4] YU X B,GUO S S,GUO J,et al.An extended support vector machine forecasting framework for customer churn in e-commerce[J].Expert Systems with Applications,2011,38 (3):1425-1430.
[5] 朱幫助,张秋菊,邹昊飞,等.基于OSA算法和GMDH网络集成的电子商务客户流失预测[J].中国管理科学,2011,19(5):64-70.
[6] SCHAPIRE R E.The strength of weak learnability[C]// Foundations of Computer Science,1989.30th Annual Symposium on.IEEE,1989:197-227.
[7] BREIMAN L.Bagging predictors[J].Machine Learning, 1996,24(2):123-140.
[8] YING Weiyun,LIN Nan,XIE Yiayia,et al.Research on the LDA boosting in customer churn prediction[J].Journal of Applied Statistics & Management,2010,29(3): 400-408.
[9] LIU M,QIAO X Q,XU W L.Three categories customer churn prediction based on the adjusted real adaBoost[J]. Communication in Statistics-Simulation and Computation, 2011,40(10):1548-1562.
[10] ZHANG Wei,YANG Shanlin,LIU Tingting.Customer churn prediction in mobile communication enterprises based on CART and Boosting algorithm[J].Chinese Journal of Management Science,2014,22(10):90-96.
[11] 刘远君.基于统计方法的交易平台型电子商务网站CRM应用研究[D].杭州:浙江工商大学.
关键词:RFM;AdaBoost;电子商务;客户价值
中图分类号:TP391. 41 文献标识码:A DOI:10.3969/j.issn.1003-6970.2021.03.001
本文著录格式:陈俊龙,吴丽丽.基于RFME模型和AdaBoost分类器的电子商务客户关系研究[J].软件,2021,42(03):001-007
Research on E-commerce Customer Relationship Based on RFME Model and AdaBoost Classifier
CHEN Junlong, WU Lili
(College of Information Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070)
【Abstract】:In order to further explore and analyze the relationship between e-commerce customers, this article proposes an index system and calculation method for e-value, and at the same time classifies customers based on the use of k-means method to realize in-depth exploration of customer relationships. Based on the improved RFM model, the function of identifying and categorizing customers is realized, and the e-value of different customers can be effectively predicted. At the same time, it can provide a basis for the differentiated implementation of marketing strategies for companies in the e-commerce-related fields. In-depth segmentation of customer relationships. At the same time, based on the AdaBoost classifier, a customer retention and churn prediction model based on the C5.0 decision tree is proposed to reduce the cost of error prediction and accurately identify high-value customers.
【Key words】:RFM;AdaBoost;E-commerce;customer relationship management
0 引言
在网络技术日新月异的当下,电子商务平台已经深入各行各业中,生活中处处可见电商领域的产品或服务。在社会发展和进步的同时,电子商务区别于以往传统的消费模式,作为全新的形式冲击全国受众的普遍认知,并使其购买行为产生了或多或少的变化。据资料显示,截止2015年,我国互联网用户已逾6亿,到2019年6月,我国网民规模升至8.54亿,手机网民规模达8.47亿,网络普及率超过61.2%。至2020年3月,我国互联网普及率已达到64.5%,网络购物用户规模达7.10亿,近2015年的两倍[1]。
2019年,我国互联网交易规模达10.63万亿元,与繁荣发展的互联网业态相对应,在全新商务模式下,对消费者管理和客户价值认知评估模式也需要推动发展与转型。与传统行业的销售模式相比,在电子商务环境下,消费者的选择空间极度扩大,信息流动迅速,客户留存率大大降低。有研究显示,电商环境下,客户流失率可高达80%,而获取新客户比保持现有客户的成本高得多,与前者相比,客户留存可节约4~6倍获客成本[2]。对电信运营商来说,用户保持率增加5%,即可为运营商带来85%的利润成长。对传统零售行業来说,在电子商务运营中提高复购率,大幅降低营销成本和服务成本,减少高价值客户流失是维持企业在电商领域长期发展的重要途径[3-4]。基于客户关系理论对电商平台现有客户进行关系识别,对高价值客户进行细致的筛选,“因客施策”,着力打造实施精确营销,将成为客户长期留存和价值提升的基础。
现有客户关系研究当中,已有多种算法和工具被运用于相关数据的统计计算及经营决策当中,从传统统计学、统计学习理论,到人工智能、组合分类器及仿生学算法等,机器学习技术逐渐被运用到企业用户管理决策当中。Renjith提出在使用Logistic回归方法深入解离客户流失影响因数的基础上,利用多个属性变量预测流失客户,并通过机器学习方法对不同的方案根据需求进行检索,并根据客户特征进行个性化组合,从而有针对性的提出细分客户留存策略。张秋菊[5]等则构建了基于FRI(自组织模糊规则归纳算法)的客户流失预测模型,通过利用数据分组处理网络(GMDH)对客户流失状态进行判别,测试样本的正确预测可达到90%以上。 为弥补单个分类器在数据预测中产生的效率与性能偏差,近年来,组合分类器被应用到客户流失预测研究中,利用高效协同工作的方式,充分整合各子分类器不同算法的优势,提高集成学习的效率和性能。Schapire提出的Boosting算法和Breiman提出的Bagging算法即是两种常见的集成学习方法,通过训练多个基础模型解决相同问题,获得数个同质弱学习器并进行正确组合,从而获得更好的性能。
Boosting算法思路主要是利用多棵决策树通过组合而形成的,彼此之间通过投票的方式对结果来进行相应的预测。在应用当中,根据分析对象的特征,产生了多种不同的优化组合方案,如在商业银行的客户流失预测中,引入线性判别LDA,对每个数据的统计属性分别计算。
AdaBoost自适应增强算法(adaptive boosting)则在其基础上改变样本的权重。AdaBoost算法在每一次学习之后将重点关注被分类错误的样本,增加分类正确率高模型的权重,有效解决了早期Boosting算法在实际运用中的困难,作为最优秀的Boosting算法之一被广泛使用在实践当中[6-8]。
本文根据电子商务所具有的一些特点,从相关客户对电商平台具有的价值出发,引入“e-value”概念。这一概念从电子销售渠道和服务商的利益角度出发,确定了影响电商客户e价值的关键指标,并结合客户价值评估模型RFM,和k-means方法将客户分类,建立了RFME模型对客户进行识别和分类。本文将提出e-value的处理规则,从而较为准确地对不同客户的e进行估值,为企业在电子商务领域实施差异化营销策略提供了依据。
在此基础上,本文通过以电子商务平台为基础,结合客户消费行为中保持与流失的走向变化,利用CRM理论提出一套预测电商平台客户保持与流失的数理模型。为印证组合模型能对客户流失情况进行更精确的预测,对不同的单一数据挖掘模型和AdaBoost组合模型分别对结果进行预测,并在一定条件下对不同模型的预测结果进行对比,从而来判断不同模型预测的精确度。改进的RFM进一步增强了分类的能力,降低错误预测成本,精准识别高价值客户并采取策略减少客户流失率,为企业电子商务业务降低成本,提高了收益。
1电子商务下的客户关系分析
1.1客户细分
客户细分具有多种角度和维度。依据帕累托原则,企业的核心利润主要由高价值客户创造,这一比例符合广泛存在的二八原则;同时,底部约30%的客户实际上为低价值与无效客户,对这部分客户投入的营销、服务和挽回成本可占到企业利润的50%。因此,有效的对客户价值进行评估和细分,是实现高效客户关系管理(Customer Relationship Management)的基础[10]。客户价值细分有助于帮助企业集中精力,为高价值及有流失可能的客户提供个性化服务与精准营销,是更高效地进行针对性营销活动的重要前提。
本研究中所指客户细分主要指客户价值细分。在电子商务时代,客户消费仍旧是企业获利的直接来源,各电商企业都逐渐由产品中心的经营模式转向用户中心导向,是否能有效进行客户关系维护,挽留流失客户,成为企业是否能保持竞争优势的重要因素。企业依据客户实际价值,对客户进行分类,对高价值客户有针对性地制定相应营销策略,向关键客户进行企业资源倾斜,能够有效提升企业获客和客户挽留的投入产出比,实际上增加利润率,扩大竞争优势,增强企业核心竞争力。这就要求企业首先能够准确对客户价值进行判断和识别。
在网络消费过程中,消费者与企业之间的信息交互呈现即时、双向、周期短的特点,导致客户产生回购的概率大大降低。同时,企业与客户进行沟通时的渠道是否稳定及时并能对问题进行解答,以及企业与客户的供求关系能否长期把持稳定,这些问题需要面临网络信息量大、信息流动速度快、产品同质化程度高、竞争压力大、客户群多样化、差异化程度高等多种挑战。
如何准确在广泛而复杂的客户与潜在客户中,准确识别高价值客户,做好流失预测并及时采取相应策略阻止客户流失,成为电子商务管理和发展人员关注的热点。在众多消费行为相关指标当中,客户消费额度直接与企业产品或服务的质量的销售量相关,并且能够直接作为客户实际价值的量化体现。本研究以客户消费额度为主要显性价值指标,依据历史交易数据进行数据提取,利用RFME模型对客户价值进行量化评估,并完成客户分类。
1.2客户保持与流失
客户流失的企业管理概念是指曾购买或使用过某企业商品或服务的客户,停止在该企业进行消费或合作行为,转而去购买或使用过竞争企业的商品或服务。电子商户客户常常与商家没有契约关系,其消费具有一过性,即在完成一次购买之后,消费者和商家之间的交易行为完成,交易关系终止;直至下一次交易之前,客户与企业之间的关系处在一种非契约关系情境下。
对电子商務运营方来说,识别高价值客户,对其流失概率进行准确预测,在发生客户流失之前进行关系维系和客户挽留,在实际操作层面具有重要意义。而对客户重复购买行为和心理的分析预测,可以帮助企业识别忠诚度更高、复购可能性更大的客户,对其消费行为和购买习惯进行总结和共性分析。围绕客户忠诚度的培养,企业可以根据客户复购决定发生的环节,和消费决策产生的动因等信息,针对性优化其产品、服务与营销手段等,增加留存客户比例,保留高价值客户,降低企业开拓新客户的成本,提升企业对客户的把握能力。
基于电商平台的客户关系推理模型,是结合之前研究结论提出的对电子商务客户关系进行预测的算法模型。它通过追踪统计一段时间内客户在电商渠道发生的浏览、消费等行为信息,对电子商务渠道客户的购买行为进行分析,依照建模细分结果,对不同价值客户进行区别化概率性对待,制定个性化客户保持策略,从而达到平台以更低成本,有效完成客户维持工作。
2基于RFME的客户细分建模 [3] ZHU Bangzhu.E-business customer churn prediction based on integration of SMC,rough sets and least square support vector machine[J].Systems Engineering-Theory & Practice,2010,30(11):1960-1967.
[4] YU X B,GUO S S,GUO J,et al.An extended support vector machine forecasting framework for customer churn in e-commerce[J].Expert Systems with Applications,2011,38 (3):1425-1430.
[5] 朱幫助,张秋菊,邹昊飞,等.基于OSA算法和GMDH网络集成的电子商务客户流失预测[J].中国管理科学,2011,19(5):64-70.
[6] SCHAPIRE R E.The strength of weak learnability[C]// Foundations of Computer Science,1989.30th Annual Symposium on.IEEE,1989:197-227.
[7] BREIMAN L.Bagging predictors[J].Machine Learning, 1996,24(2):123-140.
[8] YING Weiyun,LIN Nan,XIE Yiayia,et al.Research on the LDA boosting in customer churn prediction[J].Journal of Applied Statistics & Management,2010,29(3): 400-408.
[9] LIU M,QIAO X Q,XU W L.Three categories customer churn prediction based on the adjusted real adaBoost[J]. Communication in Statistics-Simulation and Computation, 2011,40(10):1548-1562.
[10] ZHANG Wei,YANG Shanlin,LIU Tingting.Customer churn prediction in mobile communication enterprises based on CART and Boosting algorithm[J].Chinese Journal of Management Science,2014,22(10):90-96.
[11] 刘远君.基于统计方法的交易平台型电子商务网站CRM应用研究[D].杭州:浙江工商大学.