论文部分内容阅读
在电信这个服务型行业中。企业为了在竞争激烈的市场中生存发展,客户关系管理工作的质量显得尤为重要,客户流失预测是客户关系管理中最基础也是最为关键的部分。然而在实践中我们发现,大部分流失预测模型构建原理是将客户看作一个独立的个体,主要研究每个个体的行为特征,而忽略了个体之间的相瓦影响,其预测结果并不理想,经常无法准确刻画客户行为的动态变化。而在现实世界客户是处于社会大环境中,客户的行为都会不同程度的受到身边人的影响,所以要对客户行为进行准确的预测,就必须综合考虑个人和社会影响。 本论文先对从运营商的数摒库中获得的通话详单(CDR)数据进行抽取、处理、转换,并构建出一个移动通话网络模型,然后分析了这个模型的社会网络特性。我们发现,阿络中节点的度分布、节点容量等都是偏斜分布,说明通话网络符合复杂网络特征,可以运用复杂网络中的研究方法对其进行研究。然后分析了流失这一行为是如何在移动通话网络中扩散的。通过分析可知流失行为不仅会受强连接影响,也会通过弱连接将分散的社区连接起来,使得流失行为在整个网络中传播。因此对客户流失问题进行研究时,从社会网络角度考虑局部和全局网络拓扑结构足有必要的。接下来,将社会关系引入到数据挖掘模型中,利用移动通话网络数据在weka J48分类器上进行实验,结果表明引进新的预测属性相较于之前以个人属性为主的预测模型,在预测准确度上有了很大的提升。 最后是本文的重点,为提升客户流失预测效率,在社会网络环境下提出了基于激活扩散技术的流失预测模型,同时考虑了个人影响。鉴于移动通话网络规模较大,引进了MapReduee模型,使得对海量的通话数据处理过程较为迅速。最后在真实的通话数据上进行试验,发现综合考虑个人影响和网络拓扑结构的激活扩散模型(DT-ASM)性能较传统的分类技术(DT-3)和只考虑网络拓扑结构的激活扩散模型(ASM)预测性能最好,提高了命中率,且lift曲线有了明显的改进。