基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:bands007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于企业来讲,客户关系己经成为企业生存发展所必须关注的问题,企业以客户为中心,不仅是要单纯的发挥主观能动性为客户提供服务,更要在客户的挖掘上下功夫,只有努力赢取客户,维持客户关系,在未来的发展道路上才能获得更多的利益。 本文从分析型CRM引入了客户分析的概念,并对客户分析的应用进行了需求分析,强调了数据挖掘在客户分析中的重要性,接着对客户分析的一个方面——客户流失分析做了深入研究。在当今通信行业中,一方面新入网客户不断增加,另一方面流失的客户也在不断的增加。与其网络和业务的先进性相比,通信行业的流失客户分析却显得相对落后,目前国内运营商的流失客户分析几乎没有,所以本文针对这些率先对客户流失进行了研究分析。主要工作如下: 结合行业数据特点,确定数据挖掘方法中最适合流失客户分析的是分类方法,并进一步确定了最符合流失客户分析的分类方法中的决策树生成算法和剪枝算法,提出了把基于概念层次的CART决策树分类算法应用到客户流失的设计思想。 根据网通公司提供的数据特点,以及经过初步处理,本文依据CRISP-DM标准过程设计并实现了“流失客户分析模型”。在数据预处理上,考虑到模型的实用性,本文采用了概念分层技术对数据进行了预处理,并使用分层抽样技术确定样本,它可以有效地增加目标群的比例,使流失客户的特征能够充分的反映出来。对于模型的核心部分,为了使发现的规则具有实际意义且不会过于细腻,本文提出了基于概念层次的CART决策树分类算法,在实现时不仅考虑了使用非递归算法以提高执行效率这一点,而且提出了一种新策略,即在为存储数据的数组中增加一列,作为索引项,以链接满足某个分割条件的记录,以此使决策树的构造更有效率。最后对生成的模型进行了评估分析,为初步研究做了总结,对未来可研究方向做了一些探索。
其他文献
近年来数据流数据库作为数据库领域最为活跃的研究方向已经被公认为处理无限、快速、实时的传感器数据的最佳方案,但是目前大部分数据流数据库都是以精确数据为研究对象。传
便携式电子设备的迅速发展丰富了图像信息的采集形式,如智能手机、小型无人机、行车记录仪等。虽然图像信息的采集更便捷,但是由于便携式电子设备的质量较轻、稳定性较差,易受噪
在数据库和Web技术的引导下,信息系统的数据日趋多样化、个性化和私有化,需要对数据库中的数据进行基于行、列甚至元素级的访问控制,即细粒度的访问控制。而传统在应用层部署
随着网络技术的发展,IP技术将成为语音传输的主要方式。VoIP(Voice over InternetProtocol)是一种建立在IP网络上的分组化、数字化传输技术。VoIP的出现使得人们可以通过互联
当前医疗服务正步入大数据时代,大数据将从新知识的产生、医疗质量的提高、个体化医疗和临床决策等多个层面推动医疗模式从以医师为中心向以患者为中心的改变。医疗健康是一
近年来,随着无线应用需求和市场的不断增长,特别是随着3G技术的到来,无线互联网将得到前所未有的发展。伴随着无线互联网的发展,人们的学习方式也在不断的改变,从传统的课堂
命名实体识别是目前自然语言处理研究的热点问题。MUC(Message Understanding Conferences)对命名实体的定义是:人们感兴趣的专有名词和特定的数量词,它一般可分为:人名、地
云计算的发展受到全球各国政府和企业高度重视,成为全球信息通信技术产业界公认的发展重点。同时,云计算带来了第三次信息改革浪潮,彻底改变了人们使用IT服务的方式,降低了社
数据复制是分布式数据库中提高系统可用性和可靠性的一项重要技术。长期以来,数据对象均使用静态复制方式,数据复制计划由分布式数据库管理者指定,该计划是固定的,直到管理者
Ontology是近年来知识工程领域的一个研究热点,鉴于其在知识表示和异构数据处理方面的独到之处,而在企业信息化中得到了广泛的应用。随着信息技术的飞速发展,要求构建的Ontol