论文部分内容阅读
随着电信业的迅速发展,其用户基数迅速增长,同时用户欠费的现象也日益增长,如何在改善客户感知的同时提高客户欠费催缴效率,成为电信运营商急需解决的难题。为此,可以应用数据挖掘技术,分析客户的欠费催缴信息,把欠费客户分类,针对不同类型的客户使用不同的催缴方案,实现客户差异化催缴服务。此外,传统的单机聚类方法已无法满足海量数据的处理需求,云计算的出现解决了这一问题,为聚类分析提供了一个新的发展方向。本文以南昌市电信客户信息为研究对象,在对目前电信欠费催缴模式和电信客户欠费催缴数据特征的分析基础上,构建针对欠费催缴模式的电信客户数据对象;分析云计算和聚类技术在电信用户差异化催缴领域的应用技术,研究基于Hadoop的MapReduce并行编程方法;针对K-means初值敏感的问题,提出了基于多次采样和空间密度的K-means优化策略,尽可能地减小聚类结果对初始聚类中心的依赖性,提高聚类的稳定性;提出基于Hadoop平台上的K均值优化算法(本文命名为MRDK-means算法)和实现方法,选取了UCI数据库中Iris和Wine数据集对包含MRDK-means算法在内的几种聚类算法进行了准确率、运行效率和加速比的实验分析;建立电信客户欠费催缴信息数据仓库和电信客户欠费催缴管理系统,提供集成聚类分析的客户差异化催缴、催缴效果分析、成本分析、代维管理等功能,并采用ASP.NET、Ajax、Web服务、多线程等技术增强了用户体验效果;最后,总结了课题研究工作,并对下一步的研究工作进行了展望。