基于数据挖掘技术构建电信4G客户预测模型的研究

被引量 : 11次 | 上传用户:willian_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2013年12月,中国正式进入4G时代。与此同时,运营商之间的4G客户竞争也进入白热化阶段。随着数据挖掘技术的广泛应用和运营商积累的越来越多的数据,如何利用数据挖掘技术手段处理电信大数据,受到越来愈多人的关注与研究。4G时代,针对电信业客户关系管理的需要,在现有的数据仓库技术和数据挖掘技术基础上,帮助运营商找出潜在的4G客户,扩大其市场占有份额,对电信运营商来讲具有很重大的现实意义和经济效益。本文研究的4G客户预测问题正是在这样一个时代背景下旨在为扩大运营商的4G客户规模而提出的。本文所采用的数据集来自于某电信公司。最主要的目标是建立一个准确率高的、实用性强的电信4G客户预测模型。模型的建立以数据挖掘的CRISP-DM方法论为基础。首先,在模型构建的准备阶段,本文对原始的电信数据进行了集成、清洗、规约、转换、分割等一系列的数据预处理工作,初步筛选并构建了模型的预测指标体系。然后,建立决策树、Logistics回归、SVM这三种4G客户预测模型,经过多次的模型训练与对比,最终选择出效果最好的决策树模型应用于电信4G客户预测。在模型应用阶段,参照预测模型计算出的所有客户得分情况,重点关注的对象是那些得分较高的客户,对这部分潜在的4G客户进行有针对性的业务推广和精确营销,从而达到扩大4G客户规模的目的。最后,本文还搭建了一个具有9个节点的Hadoop集群,实现了决策树C4.5算法的并行化,有效地解决了单机无法处理大规模数据的问题,验证了Hadoop平台在处理电信大数据方面的高效性与可扩展性。本文是把数据挖掘理论和实际项目相结合一个典型案例,利用数据挖掘的相关技术建立了电信4G客户预测模型。结果表明,所建立的模型是基本符合电信实际需求的,能够提供有价值的预测信息给相关的决策人员和市场营销人员,对电信运营商扩大4G客户规模具有重大的现实意义。
其他文献
四川省都江堰市是公认的猕猴桃最佳生态区之一,1981年率先从新西兰引进国际猕猴桃主流品种海沃德栽培。文章在对都江堰市猕猴桃产业发展前景和现状分析的基础上,提出以科技为
地质建模中测井数据的质量与量化程度直接影响到叠前/叠后储层预测精度,为提高地质模型的准确性,有必要利用井旁道集地震数据进行全波形叠前反演,采用地震约束改进测井曲线的
目的通过对四川省冕宁县1951-2015年疟疾发病情况的分析,对该地区疟疾流行和防治历程进行总结,并做出效果评价。方法采用流行病学调查方法,对65年期间的各年度疟疾发病率进行
目的探讨人性化护理在内分泌内科护理中的临床应用价值。方法 65例内分泌内科住院患者,随机分为观察组(34例)与对照组(31例)。对照组实施常规内科护理,观察组在常规护理的同
目的:研究白介素35(IL-35)蛋白在小鼠铜绿假单胞肺炎中的作用,并同步观察其对白介素8(IL-8)和白介素17(IL-17)表达水平的影响,探讨白介素35蛋白在铜绿假单胞菌肺炎中的可能效
目的:应用经颅多普勒超声技术监测在Trendelenburg体位(T位)下进行妇科腹腔镜手术患者的脑血流动力学变化,并进一步探讨体位改变后脑组织代谢的变化情况;探究妇科腹腔镜手术后
本文旨在研究中国非英语专业学生写作中立场副词的使用情况。通过对比中国非英语专业学生和英美本土大学生同类型作文中立场副词的使用情况来寻找二者间的差异。根据不同语言
随着射频、微波测量技术的飞速发展,可准确获取微波网络特性的矢量网络分析仪已经成为测试仪器领域中不可或缺的现代电子测量设备。本文研究的主要内容是一种双端口矢量网络分析仪软件系统设计,通过矢网的软件界面设置仪器参数实现对硬件数据采集的控制,能够对硬件模块上传的测量数据进行误差修正、分析处理,完成对双端口网络的全S参数测量,并根据需求选择不同的格式对测量结果进行显示,具有良好的人机交互功能。论文中首先根
新闻一直以来都是进行消息传递的一个重要的媒介,在现如今这个经济社会快速发展的社会,人们的生活更加的丰富多彩,而专业的名词术语也在不断的增加,这在丰富人们日常生活的过
主要探讨公路路线,在设计中存在的问题以及相应的解决措施。