论文部分内容阅读
在日益激烈的市场竞争中,传统的产品导向的营销模式已经无法再为企业带来新的竞争力,客户导向的客户关系管理(Customer RelationshipManagement,CRM)正成为企业持续效益的新来源。客户价值区分是CRM中的核心问题,它是实现高效CRM的基础。在客户价值区分中,受20/80定律的影响,客户类别不平衡是一个常见的现象。在实践中存在着大量的类别不平衡的客户价值区分问题,例如目标客户识别、客户信用评价、客户流失预测、客户反应建模等等,可以说类别不平衡是很多客户价值区分问题的一个显著特征。类别不均衡的现象给客户价值区分带来了极大的挑战,它使得容易将那些重点关注的少类客户错误区分为成多类的客户,这样的结果对管理实践毫无价值,因此如何有效处理类别不平衡已成为客户价值区分成败的关键所在。 现有客户价值区分研究中对类别不平衡的处理主要有两条途径:一是基于数据层次的解决方案,它主要是通过抽样使得数据样本实现类别平衡;二是基于算法层次的解决方案,这种方案通过改变算法内在的归纳偏置(Inductive Bias)来实现对不同类别客户区分的均衡性。从知识学习的角度来看,这两类方案的一个共同的特点就是,它们都是通过对系统内部原有信息的重复使用来解决不平衡问题,没有增加任何新的信息,而根据统计学习理论,在样本信息容量一定的前提下,模型的准确度存在上限,因此这两类方案对于少数类客户预测精度的提高多是以牺牲多数类客户预测精度为前提的。 实践提出的新问题,必须寻求新的办法解决。迁移学习是近年来在机器学习领域发展起来的一种新技术,其主要思想是利用相近领域中的知识和信息来辅助目标领域中的建模。在本文中将迁移学习的思想引入到客户价值区分实践中,利用“系统外”相关领域的客户数据信息来帮助处理类别不平衡问题,为解决类别不平衡条件下客户价值区分问题提供了一条新的思路。 本论文的具体工作如下: (1)客户特征迁移分析研究 特征选择是客户识别阶段客户价值区分的一个重要工具,目前对不平衡条件下特征选择的研究还比较少。论文中通过引入相关领域的少数类客户的信息来帮助解决类别不平衡条件下的目标客户的特征分析问题。为此,借助自组织的数据挖掘的核心技术GMDH(Group Method of Data Handling)的特征选择功能,以及集成特征选择稳定性较强的特点,构建一种解决不平衡条件下的特征选择方法TFSG(Transferred Feature Selection),并将其用于中档卷烟消费者特征分析,取得了较好的效果。 (2)基于迁移学习的客户选择建模研究 构建准确的选择模型以理解和预测客户行为是客户价值区分的重要课题之一。用于选择建模的客户样本数目不足并且不平衡常常影响到选择建模在实践中的应用。为此,提出了一种基于迁移学习的选择建模方法BTBagg(Balanced Transfer Bagging),利用相关领域的信息以提高目标域选择模型的性能。通过客户长途通讯模式选择的实证研究表明,方法BTBagg在小样本并且类别不平衡的情况下,能够得到令人满意的建模效果,特别是在特征选择后。 (3)基于迁移学习的信用卡客户流失预测研究流失预测是银行信用卡客户管理的关键环节之一。为了更有效预测出只占少数的有流失倾向的客户,提出了一种基于相似体合成的迁移学习方法,通过借助不同历史时期流失客户的行为模式特征,来提高当前客户流失的预测精度。通过某地区商业银行信用卡客户流失预测的实证研究,证明了该方法的有效性。 本论文尝试利用迁移学习方法来解决三类典型的类别不平衡条件下客户价值区分问题,实证研究表明,与现有的数据层次及算法层次的解决方案相比,新思路通过整合系统外部信息,能够更好地帮助企业找出那些重点关注的少类客户。在CRM实践中还存在大量类别不平衡的客户价值区分问题,例如客户信用评价,客户反应建模等,在今后的工作中,将进一步尝试使用迁移学习方法来解决这些问题,为CRM实践提供一种有用的工具。