论文部分内容阅读
经过多年的市场运作,国内的电信运营商都积累了大量的客户和业务数据。随着市场竞争的愈演愈烈,各运营商纷纷进行经营分析系统的规划和实施工作,期望这些系统能够帮助企业找到自己最有效的客户,开发有竞争力的业务,提高经营效率。 数据挖掘是深入把握客户,提升客户价值的有效工具。目前,对用户和业务数据的挖掘利用,还主要集中在用户自身的属性归纳上。在长期的业务观察和数据分析过程中,笔者发现,用户通话详单中蕴含着客户之间的社会关系,可以从用户之间的相互联系,以及相互联系的用户所构成的交往圈的角度,观察客户,开展客户关系营销。 本文重点介绍了数据挖掘在用户聚类方面的相关思想和实现算法,总结了用户之间相互联系的特点和规律,从用户自身的属性、用户之间的联系属性、用户的交往圈属性三个方面探讨了影响用户消费行为的因素,并给出了量化评估这种行为的计算方法,最后总结给出了一个挖掘用户交往圈的算法。该算法借鉴Google的PageRank排序方法,对用户之间相互联系的密切程度进行评估;借鉴基于密度的聚类算法(DBSCAN,OPTICS)和基于层次的聚类算法(CHAMELEON,CURE),生成用户的交往圈,并将交往圈中的用户进一步分类为核心用户和从属用户。这样一来,我们就可以将有限的资源投入到核心用户中去,借助核心用户的交往圈,宣传电信业务,推广电信产品,提高客户服务水平,增强客户的满意度。