论文部分内容阅读
当前,随着全球通信技术及市场经济的快速发展,企业之间的竞争也日益加剧,迫使企业将传统的以产品为中心的粗放经济模式向以客户为中心,以服务为目的的市场战略转变,要想在日益白热化的市场竞争中立于不败之地,加强与客户之间的联系,及时了解客户需求,发掘潜在的客户价值和资源,就成为了企业的生存之道。因此,围绕着客户关系管理展开的一系列理论研究及实证分析便应运而生。客户分类作为客户关系管理的一项重要内容,在企业进行经营决策的过程中发挥着越来越重要的作用。企业通过将不同的客户划分为不同的类型,针对这些不同类型的客户群体的特性展开相应的市场营销或客户服务策略,以提高客户的响应率及商业活动的有效性。传统意义上的客户分类方法只是基于简单的数理统计或者主观意念的划分,往往依据管理者的经验或者企业客户的一些简单属性,而客户数据库中的大量数据没有得到有效地利用,同时隐藏在这些数据背后的有价信息也没有得到挖掘,因此,管理者不能及时发现企业现有的高价值客户群体及低价值客户群体各自具有的特征,以便在进行商业活动时做到有的放矢,提高活动的响应率及有效性,仅仅依靠传统的客户分类方法无法完成这些数据挖掘工作。
数据挖掘技术作为一门交叉学科,可以将企业数据库中存储的海量客户数据转化成有价值的信息和知识,帮助企业进行客户关系管理及经营决策。而如何提取这些数据并经过一系列程序处理,将其转化成有用的知识以提供给最终的管理决策成为一个巨大的挑战。仅靠单个数据挖掘算法无法有效地实现信息的提取,因此,必须根据客户数据库中现有数据的特点,结合多种数据分析方法,对原始数据进行清洗、整合及转换,使其更加适合后续的客户模型建立。分类算法是数据挖掘学习中一个重要的研究方面,分类技术是一种根据输入数据集建立分类模型的系统方法,该模型能够很好的拟合输入数据中类标号和属性集之间的朕系,目的是可以预测未知样本的类标号,从而正确的对新样本进行分类。从数据中生成分类器的一个特别有效的方法是生成一棵决策树,其表示方法是应用最广泛的逻辑方法之一,经常用于分类和预测,它也是一种简单且有力的知识呈现方法。决策树作为一种主要的分类方法最大的优点在于它是一种很容易理解的模型。许多机器学习模型,如神经网络,很难去对它进行描述,特别是对于非计算机专业人士来说。另外一个原因在于决策树能够将最重要的属性从一个数据集中分离出来,并且忽略其他次要的部分。这种能力能够使人们更好的去理解那些最重要的数据。而粗糙集知识理论作为一种可以处理不完整和不确定信息的数学工具,可以完善数据挖掘其他算法的弱点,对那些不精确、不一致或者不完整的噪音数据进行有效地分析和推理,从而发掘出这些数据背后隐含的知识和规律。因此,可以利用粗糙集知识理论解决很多数据挖掘领域内相关问题,如连续属性离散化、属性和属性值约简、属性重要度分析,决策规则的提取等。
本文在基于粗糙集知识理论及其他数据挖掘方法的基础之上,以国内某一零售企业的会员数据集为例,在传统客户分类的基础之上利用动态分类模式实现客户类别划分,而通过将客户关系管理与数据挖掘算法两个学科进行交叉研究,利用各自的优势从不同的角度分析企业客户消费行为特征,首先对原始不完备会员信息及历史消费记录等相关数据进行清洗及整合,并将连续型条件属性在改进后的离散化算法运行之后,从众多条件属性中选取对于决策起到关键作用的属性集,实现属性约简,最后利用得到的约简属性集构建决策树模型,推导出客户分类规则,并针对不同的客户群体提出相应的市场营销策略,指导企业对其现有客户更好地进行客户关系管理。数据分析过程中通过利用不同的分类变量运行改进后的数据挖掘算法,一方面实现了更加准确的客户分类,可以使企业看到客户消费模式的演变,另一方面从不同的角度出发,验证了模型和算法之间的相关性以及改进算法的有效性。