论文部分内容阅读
20世纪90年代以来,客户关系管理(Customer Relationship Management,简称CRM)成为企业营销策略研究和营销系统应用关注的焦点。客户价值细分作为CRM的重要问题之一,是实现高效CRM的基础。在客户价值细分研究中,通常使用单一聚类方法对客户进行细分,但是在解决实际问题时,单一聚类方法结果的准确性和稳定性往往不能令人满意。聚类集成学习技术将不同的单一聚类模型结合起来,使每一个聚类模型都在其优势空间区域发挥作用,将不同聚类模型的聚类结果进行融合,得到综合聚类结果,能够改进单个聚类模型的不足,提高客户价值细分的效果。本文以此为出发点,将聚类方法和集成学习技术相结合,提出了一些新的聚类集成方法,成功运用到客户价值细分实际问题。 本文的主要研究工作如下: 1.提出了基于t-范数集成策略的聚类集成模型FCEN 为了较好地描述客户行为的不确定性,论文用Bagging方法训练出多个FCM(模糊聚类算法)作为基聚类器,以t-范数方法作为集成策略,构建了聚类集成模型FCEN.在UCI标准数据库中的10个数据集上的实验结果表明,与常用的单一聚类方法(k-means,FCM)和最常用的聚类集成方法MAJ(称为多数投票的聚类集成方法)相比,FCEN有更高的聚类有效性;FCEN算法比k-means和FCM两种单一聚类方法具有更好的稳定性,与MAJ算法的稳定性相当;FCEN算法的相对时间复杂性低于MAJ算法。 2.提出了基于相似矩阵集成策略的聚类集成模型SOES 为了客观确定客户的类数,论文用随机映射(Random Projection)方法训练多个OCA(客观聚类算法)作为基聚类器,以相似矩阵作为集成策略构建了聚类集成模型SOES.该策略在进行集成选择的过程中,同时考虑了集成的准确性和多样性。在15个UCI标准数据集上的实验表明,SOES算法的聚类有效性优于k-means、FCM单一的聚类算法以及MAJ聚类集成算法:在稳定性方面,SOES聚类集成算法优于MAJ和FCEN聚类集成算法;SOES算法的相对时间复杂性比MAJ算法和FCEN算法都低。此外,SOES克服了传统客户细分方法对于细分需预先设定聚类数的缺点,提高了模型对客户行为描述的客观性。 3.构建了两阶段优化客户价值细分模型FSGA-FCEN 由于目前大多数客户细分模型都是利用数据集的所有属性或主观选择部分属性进行客户细分,在这种情况下,一些不相关的变量或冗余变量可能会对细分结果产生不利影响,因此,在进行客户细分之前需要要对全部属性进行特征选择。本文将特征选择和聚类集成方法相结合,提出了一种两阶段客户价值细分模型FSGA-FCEN。具体做法是:根据聚类方法的特点,构建了一个基于遗传算法的无监督特征选择算法FSGA,然后对特征选择所筛选出的属性利用本论文提出的聚类集成模型FCEN进行客户细分。在16个UCI标准数据集上的实验表明,与利用全部特征进行客户价值细分的聚类集成模型FCEN相比,两阶段客户细分模型FSGA-FCEN具有更加优越的客户细分有效性和稳定性。 4.实证研究 本文对某商业银行的信用卡客户数据集用两阶段优化模型进行客户价值细分。由于信用卡客户数据样本包含不相关或冗余的变量,在用FSGA方法进行特征选择的基础上,利用聚类集成模型FCEN对选择出的变量进行客户价值细分,并对细分结果进行了分析,阐述每个细分客户群的客户特征,对银行的营销策略提供建议。 本文运用聚类集成技术进行客户价值细分,主要创新点如下: (1)构建了新的聚类集成模型:在基聚类器是模糊模型时,构造了基于t-范数集成策略的聚类集成模型FCEN;在基聚类器得到的聚类个数不同时,构造了基于相似矩阵集成策略的聚类集成模型SOES. (2)提出了两阶段优化客户价值细分模型FSGA-FCEN.构建了一个基于遗传算法的无监督特征选择算法FSGA,通过运用特征选择去除数据集的不相关特征和冗余特征,减少他们的干扰同时降低数据集的规模。对FSGA所筛选出的属性利用FCEN聚类集成方法进行客户细分。实验表明,客户价值细分模型FSGA-FCEN提高了聚类集成学习的效率和效果。