基于数据挖掘的客户行为分析和预测研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:zhenyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经济全球化和多样化使得企业从“以产品为中心”向“以客户为中心”转变,客户关系管理(CRM)成为企业竞争力的一个重要方面。利用数据挖掘技术分析这种海量的CRM数据,可以挖掘出有关客户的潜在的有用的知识,帮助企业了解现有客户的购买习惯,为客户提供个性化的、更能满足其需求的服务。同时,基于数据挖掘的客户关系管理,有利于企业发现、吸引和拓展潜在客户,从而最大化客户对企业的商业利润。因此,研究数据挖掘技术在CRM中的应用,具有重要的理论指导和实际应用价值。分类和预测是数据挖掘领域中的一个重要研究课题,很多相关的研究结果已经用于客户关系管理中。本文基于法国电信运营商Orange公司(KDDCUP2009数据集)提供的数据集,建立数据挖掘流程,在数据预处理后实现和改进了三种分类算法,并提出四种集成分类器算法,完成对客户的购买欲、忠诚度和增值服务的分类和预测。最后,设计实验评价各种分类器的性能,并对实验结果进行比较分析。本文的主要工作包括:数据预处理:数据预处理是数据挖掘工作的重点,数据预处理的好坏,对数据挖掘的最终效果有着直接的影响。因此本文中的数据预处理分为两步,初步预处理和二次预处理。初步预处理主要包括:数据观察,数据清理,离散化处理和属性特征选择。而二次预处理或深层预处理,则依赖于具体的分类模型。分类模型的构建:针对Orange公司提供的客户数据集,本文首先探索了多层感知分类器(MLP:Multilayer perceptrons)的算法实现。而后应用经典的支持向量积(SVM: Support Vector Machine)算法构建第二个分类器。最后,基于逻辑模型树(LMT:Logistic Model Tree)构建第三个分类器。为了提高分类性能,我们设计实现了四个集成分类器,分别是:基于后验概率的集成分类器、基于投票的集成分类器、基于后验概率的加权集成分类器和基于投票的加权集成分类器。实验设计及结果分析:本文首先给出了整体实验框架,而后通过对三种经典分类算法的实验结果,以及最后集成分类器的实验结果比较,本文应用ROC曲线下面积(Area Under the Curve, AUC)作为评价指标,对三种经典分类器实验结果和集成分类器进行分析。对于单个分类器来说,改进的逻辑模型树分类器的分类效果明显好于多层感知器和支持向量机。对于集成分类器来说,基于后验概率的加权集成分类器和基于投票的加权集成分类器要更好一些。本文把数据挖掘理论和Orange公司提供的客户数据集相结合,通过对数据挖掘流程的实现,最终完成了对客户购买欲、忠诚度和增值服务的预测。实验结果表明,本文所实现的经典分类预测模型和集成分类器模型是科学有效,并且基本符合应用实际。因此,本文所提出的模型在客户关系管理中具有很重要的意义。
其他文献
针对传统神经网络学习算法(如BP算法、RBF算法)等训练权值难以反映训练样本信息的缺陷,南京邮电大学的张代远教授在专著《神经网络新理论与方法》提出了样条权函数神经网络算法,
随着互联网的社会的各个方面的渗透,个人信息越来越多地出现在网上。人物搜索引擎作为互联网技术的一部分,近几年刚刚兴起,而针对某一特定领域的人物搜索也是一项新生事物,对
动态二进制翻译解决了软件的跨平台问题,使得不同处理器之间的二进制程序可以很容易地相互移植,同时扩大了软硬件的适用范围,打破了处理器和支持软件之间互相依赖的局面,因此
研究发现各种复杂网络都具有社团结构,正确高效地将网络划分为合理的社团是有效地理解和利用这些网络的前提,找到网络社团划分的精确解是一个NP难题,当网络规模很大的时不存在有
随着科学技术的不断进步,人们生活水平的不断提高,家居生活智能化已经成为一种趋势。舒适性不再是家居生活的唯一的标准,安全性、智能型越来越受到人们的重视。而现代家居火
面向服务的体系架构(Service-Oriented Architecture,SOA)是近年来信息技术领域中的重大热点之一,被广泛用于异构系统的集成。SOA凭借自身松耦合的特性,使得企业可以按照模块
网络计算模式把计算任务交给各种分布的计算资源,而数据的存储集中于具有按需部署功能的存储设备或系统中,即存储在存储资源中的系统数据不再属于某一特定的计算主体,而是可
随着汽车技术的发展以及在人们生活中的普及,我们对于车载网络的容错功能和带宽有了更高的要求,现有的汽车总线系统例如CAN总线已经逐渐难以满足大量的数据通信的要求,因此新
目前,研究网络安全态势的方法大多是对数据源上日志数据进行关联、处理和分析,得出当前网络态势情况,进而对网络安全态势进行预测。然而这种方式存在诸多问题。网络中各种网
3D地震勘探项目中常常使用手持GPS或者是高精度GPS-RTK设备进行测点定位。数以万计的炮点和测点位置的测定、遍历,所需时间、人力以及高精度仪器价格等因素均推高了地震勘探