基于数据挖掘技术的个人客户识别模型的研究及应用

来源 :成都理工大学 | 被引量 : 7次 | 上传用户:sumjoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信企业的重组和3G牌照的发放,中国电信市场进入更加激烈的全业务竞争时代,如何适应日趋激烈的市场竞争环境,成为电信企业的重要问题。电信行业重组,中国移动面临着诸多的压力:如何应对由技术发展日新月异而引起的错综复杂的产业格局?如何经营自主研发的、不太成熟、在国际舞台上支撑力度弱的TD标准?如何应对“一家独大”局面受到的不对称监管的困境?如何经营已经开始的全业务模式?如果还是通过一些传统的、简单的数据统计,对于数据的利用仅限于数据的表层信息,而没有去挖掘数据之间更加深层次的信息,是不可能从如此海量的数据和信息中找到解决复杂问题的规律的。数据挖掘技术是一种功能强大的新技术,它能帮助企业在构建数据仓库中找到最重要的信息。本文利用数据挖掘技术找到个人客户的流动特征和规律,并应用数据挖掘技术来构建个人客户识别模型,主要研究内容有:分析并研究数据挖掘技术在移动个人客户识别模型中的应用;研究并初步实现了个人客户识别模型在移动业务相关领域的应用;针对C4.5可以通过改变样本的权重来处理属性值的缺失,利用C4.5的这种特性,对C4.5算法稍做改进可以得到一个基于代价敏感的变种算法C4.5_cs,并将这种算法应用到个人客户识别模型中;在建立个人客户认别模型时,提出了交往指数和符合率的指标,将这两个指标应用到模型构建中,对应用前后的C4.5_cs算法做了对比分析。本文主要基于中国移动现有的经营分析系统,针对中国移动的现实需求,重点研究讨论了决策树算法,从海量的业务系统数据中,分析挖掘个人客户的流动特征,利用决策树算法C4.5_cs建立个人客户识别模型,并利用模型生成的规则实现了模型的应用;模型通过对用户通话特征及个人信息特征等多种信息的分析挖掘,以个人客户交往圈匹配算法为核心,在用户全生命周期(获取期、成长期、成熟期、衰退期、流失期)之外,找到用户在获取期之前(游离期)的来源以及在流失期之后(离网期)的不同去向,使我们对用户的了解更加深入,从而为业务人员进一步了解客户提供帮助,为进行挽留用户和精准营销提供支持。
其他文献
大量实践证明,减少油气田勘探时间具有巨大的经济效益,在石油勘探阶段,大部分时间耗费在地震资料的地质解释上。地震资料解释的难点是断层和地层的检测。本课题本着加快地震资料
随着互联网的发展,可以获取和利用的图像信息越来越多,如何从这些图像信息中检索出自己需要的图像信息成为当前比较活跃的研究领域之一。形状特征作为图像低层特征之一,作为
随着计算机信息技术的发展,尤其是互联网的兴起,各个应用领域原有的单机系统迫切需要进行集成整合。以新兴的SOAP协议为基础的Web Services应用体系,恰恰可以作为系统平台整
为了保证Web应用程序的质量,Web应用必须进行相应的测试。随着Web应用程序规模和结构复杂性的增加,回归测试行为往往受到时间等资源的限制。因此,Web测试效率亟待提高。越来越多的自动化测试工具正在被广泛使用,这些工具能在一定程度上提高Web测试效率。但在回归测试中,固定不变的网页元素定位器十分脆弱,往往会导致测试用例失效。为此,本文提出相应的方法来自动生成网页元素XPath定位器,通过爬取网页页
学位
随着因特网的普及和多媒体处理技术的迅猛发展,多媒体信息的共享己成为网络时代的主题,但随之而来的是数字化信息的安全性面临着严峻的挑战。因此,对网络传输中的多媒体信息
随着LTE网络建设的快速发展和4G用户的不断攀升,对无线网络的需求越来越高,网络质量成为影响用户满意度的关键因素。如何在网络快速发展的情况下对4G网络进行优化,提高网络利
随着智能手机功能的增强和移动互联网的普及,智能手机占手机总数的比重飞速增长,针对智能手机的恶意程序和黑客攻击也逐渐增多。但智能手机的安全防护水平还停留在初级阶段,
在计算机辅助近景摄影测量系统中,用相机从不同方位对场景拍摄一组照片,在计算机上对该组照片上的目标点进行标记,获得各个标记点在不同照片中的二维坐标值,经过一系列算法,
云存储系统为存储大规模数据应运而生,其底层采用分布式文件系统作为存储平台。HDFS(Hadoop Distributed File Sysytem)是开源的云计算平台Hadoop提出的分布式文件系统,其设
互联网的快速发展,使得网络的规模越来越庞大,结构越来越复杂,网络用户数量呈指数级增长,而网络中的非关键业务的泛滥也导致网络的带宽资源被大量地消耗,影响了其他关键网络