论文部分内容阅读
随着市场环境的日益成熟,竞争日趋激烈,客户资源日显重要。现代企业管理的重心随之从传统的生产、物流、财务等内部管理转向全面的客户关系管理(CRM).CRM系统因而成为企业的核心管理系统之一。作为管理客户资源这一企业资源的信息系统,CRM系统必须具有强大的数据分析和挖掘功能,为管理者做出正确的决策提供及时而准确的依据。数据挖掘技术已成为CRM系统提供决策支持的关键技术之一。 本文在概述了客户关系和数据挖掘的基本原理的基础上,介绍了数据挖掘如何应用于客户关系管理中。本文的创新点在于研究如何在大型和动态的客户数据上进行挖掘,并对支持度算法结合实际情况做了一点改进;初步探讨了CRM系统在制造型企业的应用情况以及其数据仓库结构与数据挖掘的流程图。 论文的第一章,介绍了CRM的概念,CRM的体系结构与功能模块,以及实现CRM的若干技术要素。 传统的CRM概念过于强调CRM的某一部分功能,而概念三角型模型则能完整地表达CRM既是一种理念,也是一套管理软件和技术的特征,三条边分别是:以互联网技术为主要代表的IT技术,以根据客户终生利润贡献能力的大小,充分调配可用资源以有效地建立、维护和发展同客户的长期合作关系的经营理念,以针对“营销、销售、服务”等业务领域设计的各种计算机应用模块。 CRM的应用模块通常分为销售自动化、市场营销和服务与技术模块。销售自动化可以快速获取和管理销售信息,提高销售人员的工作效率,避免销售单干的现象;市场营销管理提供完整的客户活动、事件、潜在的客户和数据管理,从而使寻找潜在客户工作效率更高、更合理化;服务的支持管理模块综合所有关键客户信息,并管理日常的客户服务活动和任务。从体系结构上分,一个CRM系统应由操作、分析和合作三个部分组成,而以数据挖掘技术为核心的分析型CRM正是目前最具发展潜力的CRM。 实现CRMS的若干技术除了考虑数据仓库建设工具、OLAP工具和数据挖掘工具以外,还要考虑到数据和结构功能的灵活性、并行处理能力以及系统的扩展性. 在第二章中,介绍了数据挖掘的基本原理。为数据挖掘提供有效平台的数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策。数据仓库的主要结构包括:数据模型、数据集市、ETI工具、管理平台、OLAP和数据挖掘。 目前用于CRM方面的四种主要数据挖掘技术中:①回归预测:根据历史记录分析得出总体趋势,并将这种趋势用数据方程式表示;②决策树:对数据进行归类分割和预测,在CRM中主要用于根据客户的特征,对客户大市场进行分割,从而得到相对较小的客户群体,从而展开针对性的市场营销活动;③神经网络:是一种简单模拟的人脑信息处理的技术,用于CRM中可以对客户行为进行分析和预测,相对于决策树的定性分析预测,神经网络可以达到定量阶段,④规则导引:关联规则、序列规则、分类规则、聚类规则。通过聚类规则按照数据间的自然联系把分散的记录“聚成”几“堆”,然后再对每堆进行深入分析,除此之外,对于不符合数据一般模型的孤立点的分析在欺诈中,预示着欺诈行为。 CRM系统中的数据挖掘步骤主要分为:①确定分析和预测目标:即想通过数据挖掘解决什么样的问题,达到什么目的,并将该问题转为可以测量的目标;②了解数据,了解数据从哪里来,如何摸索这些数据;③数据准备,即对已确定的基本数据进行必要的转换、清理、填补以及合并工作;④数据相关性前期探索,有些数据挖掘在定性和数据分类方面使用方便,可以用作为更高一级预测的“探索”工具;⑤模型构造,选择适用的挖掘技术,采用相识的算法确定输入和输出关系,即建立模型,并对模型进行解释、评估和检验;⑥所建立的模型可信,并在预定误差范围内,就可以企业范围内布置这个预测模型。 第三章是本文的一个重要创新点,介绍了数据挖掘技术在CRM中的应用,即如何在动态的客户数据上进行挖掘.首先根据客户的事务性数据划分出客户的兴趣和行为,其次,通过过滤兴趣和行为的支持度得到客户的兴趣和行为知识,然后利用聚类分析的距离测算将客户分类,最后,根据客户类别的不同采取不同的营销策略. 所谓客户的行为就是指客户对购买对象的信息收集,客户的兴趣就是根据收集到的信息进行针对性的购买。分别用两个公式可以表示:客户行为B={[c,d]sup([c,d])>=β},客户兴趣I={c(|)sup(c)>=α},当支持度大于阀值时,就可以分别代表客户的行为和兴趣. 在这里对支持度的计算方法做了一点改进,改进的支持度算法Sup(c)=count(c)/T-first(c)+1较之于原来的支持度算法Sup(c)old=count(c)/T充分考虑了最近的、连续购买行为,并在过渡支持度时考虑了以下两点:①只有一次的购买活动,②两次购买时隔时间过长,超出时限,将按新基准计算。 包含了以上因素的兴趣表格和行为表格可以反映出客户的行为和兴趣,根据客户兴趣和行为的关系可以将客户分为六类,并对类间进行距离测算,将距离小于阀值的客户归为一类,以达到“物以类聚,人以群分”的针对性目的。 在进行距离计算时,运用了兴趣—行为矩阵.如果用户行为知识出现在相应的商品目录组合,这两个商品目录的关系就以1代替,反之,用0代替.同时,如果商品目录出现在客户的兴趣知识中,对角线上就会出现1进行代替,反之就用零进行代替。串联这些数字,就可以得到不同用户的兴趣行为分量,用公式distance(A,B)=(√)n∑(l=1)|Ai-Bi|2计算得到不同用户之间的距离,若小于设计的极限值,就可将这些用户归为一类。 鉴于现实世界的数据的不断变换和不断更新,对新增数据的测量采用质心法将大大减少计算的数量。所谓质心法就是用一点代表一类客户的质心,当有新数据出现或客户的兴趣行为知识发生变化时,只需按公式D=1/NN∑(l=1)X1与该质心点进行计算,如果距离超出原来的极限值,就认为产生了一个新类。 应用客户的兴趣—行为知识,即使客户节约了时间,得到满意的服务和产品,企业也可以减少推销成本,抓到更多的顾客以增加利润。 在第四章中,介绍了在CRM中建立和启动数据挖掘系统应该注意的几个关键问题:①问题定义,定义CRMS中的关键问题,并将该问题尽可能细化;②用户定义,掌握用户的基本情况,了解用户的不同需求;③数据定义,定位数据字典,评估数据和验证数据源;④挖掘项目的范围;⑤立即实施实验,以验证数据挖掘应用的模型;⑥将质量保证贯穿项目实施的全过程;⑦教育培训;⑧发布数据挖掘结果;⑨维护。 第五章,结合北京巴威公司的情况,介绍CRM在制造型企业的应用情况。较之于服务型企业制造型企业的客户数量相对较少,因此CRM的价值更主要体现在帐目管理、订单管理和客户跟踪服务方面。 企业级的CRM系统分为三个层次界面层、功能层和支持层。界面层是CRM系统同用户或客户进行交互、获取或输出信息的接口。功能层由执行CRM基本功能的各个分系统构成,各分系统又包含若干业务,包括客户销售管理分系统、客户市场管理分系统、客户支持与服务管理分系统.支持层则是指CRM系统所用到的数据仓库管理系统、操作系统、网络通信协议等. 在企业CRM中的数据仓库中,介绍了最主要的三个主题:销售主题、营销主题、服务主题及各个主题的星型模式。针对该系统中的数据挖掘功能,介绍了客户行为分析与基于类别的潜在客户挖掘的数据流图。 在最后一章,在总结全文的基础上,介绍了CRM及数据挖掘在CRM中应用的新趋势。随着CRMS外围技术的成熟,CRM将更注重于各应用模块之间进一步加强整合;更强调与其他应用,如与ERP的整合等;CRM系统将全面采用Browser/Server技术;将更多地采用数据仓库和数据挖掘技术. 随着CRM的发展,信息挖掘也会更加重视是传统数字信息容量3~5倍的存储在无数组织文件中的信息,即文本挖掘. CRM的蓬勃发展不过几年的时间,因此,还有很大的上升空间。随着计算机网络、分布式计算、数据仓库等技术的不断发展,以及ERP、CIMS、电子商务等的普遍应用,CRM必将作为现代企业信息化管理的重要组成部分,日趋深化和成熟.