论文部分内容阅读
随着大数据时代的到来,移动互联网快速发展使传统电信运营商面临着互联网企业以及同行业内的双重压力,运营商手中掌握着大量的用户数据,却苦于无法从数据中获得其潜在的商业价值,这对传统电信运营商转型提出了迫切的要求。使传统电信运营商必须向数据驱动的商业模式转变,从而提升企业的竞争力。国内电信企业将数据挖掘技术结合业务数据主要应用于产品的精确营销、客户分群、客户行为分析、客户流失预测、套餐制定以及电话欺诈等等。但大多都只是处于研究阶段,并未使用到实际生产当中,国内运营商对大数据和数据挖掘等技术的应用还处于起步阶段,还需要不断发展。对于企业来说,客户都是企业最重要的资源,如何最大程度保留有价值、价值高的客户是企业永恒的目标。一是通过价格优势或提出新产品来发展新的客户,二是通过提升服务和实施客户挽留、客户价值提升的政策最大限度的留住老客户,而第二种方法所需要的成本明显低于第一种,运营商们出于成本的考虑将重点放在客户挽留。而在现实生活中,用户的流失都是无预兆和没有规律可循的,只有实现用户的流失预测,及早发现可能流失的用户并对其采取正确的挽留措施,才能尽可能的保证企业的客户资源不流失。本文按照跨行业数据挖掘过程CRISP-DM的6个步骤,从电信某公司的多个子系统中提取出了客户信息、账户信息以及移动用户的语音、数据、增值业务等行为信息,通过数据集成、清洗、规约、转换等方法对数据集进行处理。使用BP神经网络算法实现了电信用户的流失预测,模型的预测命中率可以达到82.12%。同时使用Map Reduce的编程框架将算法在Hadoop平台上进行了部署,在保证了算法的准确度的情况下,解决了在单机计算量有限的问题,有效地提高了模型训练效率。实验表明了基于MapReduce的编程框架下的BP神经网络算法在处理海量数据时具有明显优势。