论文部分内容阅读
随着市场竞争的加剧,客户关系管理(customer relationship management,CRM)成为企业关注的焦点。CRM的核心目标是极大化客户对于企业的价值。众所周知,对于一个企业而言,其每个客户所具有的价值往往是不一样的,通常80%左右的利润是由20%左右的客户创造出来的。企业只有把有限的资源投入到最有价值的客户身上才能获得最大利润。因此,科学的客户价值区分是企业实现高效CRM的基础。本文以此为出发点,提出了一种客户价值区分的新思路。
本论文主要研究成果如下:
(1)客户价值区分集成的基础研究
在客户价值区分中,客户数据的特征往往会影响区分的效果。与已有的s“两步式”客户价值区分策略不同,本文采用问题导向型的研究范式,将自组织数据挖掘与集成学习相结合,提出了客户价值区分“一步式”集成框架,该框架不仅能够将数据预处理和客户价值分类建模进行有效地融合,而且在建立客户价值分类模型时,也能将多个分类器的分类结果进行集成。
(2)基于GMDH的集成方法研究
为了改善多分类器集成的分类性能,本文从两个方面着手:①改进基本分类器的分类性能。将自组织数据挖掘中的核心技术一数据分组处理方法(GMDH)与常用的贝叶斯网络分类器相结合,提出了基于GMDH的选择性贝叶斯网络扩展的朴素贝叶斯分类模型SBAN,进一步地,为了得到SBAN分类器的结构,我们提出了基于GMDH的贝叶斯网络结构识别算法GMBC。试验结果表明,GMBC学习得到的SBAN分类器具有较好的分类性能,与常用的分类器相比,具有更强的抗噪声干扰能力。②改进集成策略。论文首先将GMDH与集成学习相结合,提出了基于GMDH的静态分类器集成选择策略GSES。在15个标准数据集上的实验表明,与常用的集成方法如多数投票、遗传算法等相比,GSES具有更高的分类精度。同时,它还具有很好的自适应选择特性,能从基分类器池中选择一个合适的分类器子集,从而提高客户分类的精度。进一步,将这一策略进行扩展,提出了基于GMDH的动态分类器集成选择策略GDES-AD。在30个UCI数据集上的实验分析表明,GDES-AD比其它6种动态集成策略具有更强的抗干扰能力。同时与Bagging相比,使用随机子空间方法RSS生成基分类器时GDES-AD的抗干扰能力更强。而对各种方法的分类误差进行偏差-方差分解发现,GDES-AD的抗干扰能力主要在于它能够更好地降低分类误差中的偏差部分。
(3)客户价值区分典型问题分析
客户价值区分问题的种类有很多,论文以客户数据包含噪声、类别分布不平衡、包含缺失数据为例,分别构建了面向噪声数据的客户价值区分“一步式”集成模型R-GDES-AD,面向类别不平衡数据的客户价值区分“一步式”集成模型DCEIB,面向缺失数据的客户价值区分“一步式”集成模型GDCEMV。通过在“german”数据集上进行实验得出以下结论:1)不管是在类别噪声还是在属性噪声情况下,与5种用于噪声数据条件下的“两步式”客户价值区分策略相比,R-GDES-AD都具有最好的分类性能,同时也具有最好的抗噪声干扰性能。2)与常用的用于类别不平衡数据的“两步式”客户价值区分策略相比,DCEIB具有更加优越的分类性能。3)与常用的面向缺失数据的“两步式”策略相比,GDCEMV具有更强的处理缺失数据的能力,在该数据集包含5%,10%,20%,30%的缺失等4种情况下均均能取得最好的分类性能。
(4)“一步式”客户价值区分实证研究
使用本文提出的客户价值区分“一步式”集成解决方案来进行客户流失预测以及客户信用评估的实证研究。在进行客户流失预测研究时,以“churn”数据集为例,针对它类别分布高度不平衡但不包含噪声和缺失的特点,选择面向类别分布不平衡的“一步式”集成模型DCEIB,结果表明其预测性能要优于已有的“两步式”策略。而在进行客户信用评估时,以“australia”数据集为例,针对其包含缺失数据但不包含噪声以及类别分布相对比较平衡的特点,选择面向缺失数据的“一步式”集成模型GDCEMV。结果表明GDCEMV具有很好的适应性,与已有的一些方法相比,它能够取得更好的客户信用评估效果。