论文部分内容阅读
[摘要] 本文阐述了在CRM中应用数据挖掘的必要性,给出了CRM的体系结构,介绍了应用SQLServer2005数据挖掘工具的流程,最后总结了目前存在的主要问题。
[关键词] CRM 数据挖掘 SQLServer2005
一、前言
中小企业要想在激烈的市场竞争中谋生存求发展,就要努力提升自己的核心竞争力,从以往的“以产品为中心”的管理模式转变为“以客户为中心”的管理模式,这就需要构建客户关系管理系统(CRM)。数据库技术的成熟应用已使企业积累了大量的数据,管理层渴望从数据海洋里获得关于客户的准确的有价值的“知识”,利用这些“知识”实现客户细分,保持老客户,获得新客户。但是传统的数据库管理系统是面向应用的,只处理日常的经营业务,不具备智能数据处理的功能,如何获得这些“知识”就促成了数据挖掘技术的产生。反过来,数据挖掘技术的发展使构建智能化CRM系统成为可能。概括地讲,数据挖掘的任务是从数据仓库中提取人们感兴趣的,事先未知的,有用的或潜在有用的信息。
目前,国际上主流的数据挖掘工具有:SAS的Enterprise Miner;SPSS的Clementine;IBM的Intelligent Miner;Oracle的Darwin;Cognos的4Thought以及微软的SQLServer2005挖掘平台。选择什么样的数据挖掘工具,应该视企业的实际情况来定,功能最强的不一定是最合适的。考虑到中小企业CRM系统的以下特点:软件开发和维护成本相对低;功能不是很复杂;数据量不是很大;容易与其他系统集成等,SQLServer2005挖掘平台是最佳的选择。
二、CRM的体系结构
基础层为CRM系统提供Internet,Intranet,以及数据库,数据仓库,数据挖掘,联机分析处理(OLAP)和Web服务等软硬件技术支持。
操作层主要是提供以客户为中心的市场、销售、服务与支持等业务流程的自动化及扩展。包括销售力量自动化(Sales force Automation,SFA)、企业营销自动化(Enterprise Marketing Automation,EMA)、客户服务与支持(Customer Service&Support)三个基本模块。
分析层主要是利用数据挖掘技术,从共享的客户数据仓库中,提取有价值的信息,准确地了解客户行为、期望、需要、历史和与企业全面关系,为企业的战略决策服务。
协同层基于协同产品商务,协同性不仅体现在对客户信息的获得和跟踪方面,还强调在与客户进行的一系列业务中,内部人员之间及内部与外部之间的高效互通及协作。
三、SQLServer2005数据挖掘的流程
1.定义企业问题
確定目前企业遇到的问题。例如分析客户的流失情况,就要考虑这些问题:现有的客户哪些客户即将流失?现有客户他们的流失概率如何?哪些因素造成了客户的流失?不同类别之间客户的流失情况有什么差别?如果某个客户将要流失,他会在多长时间内流失?
2.数据准备
在企业信息化建设中,“三分技术,七分管理,十二分基础数据”,所以数据准备是最关键的一个环节。CRM在整个生命周期中,都以客户为中心,准确全面的客户信息是构建CRM系统的基石。为了进行有效的客户分析,这些信息必须在整个企业范围都是一致的,可靠的,并且具有统一的,便于使用的编码。然而,来源于历史上各个数据库的数据往往是异构的,不一致的,分散的,同时企业在收集客户信息的过程中,存在局部,片面,重复的现象,因此,建立一个企业范围内全局一致的客户数据仓库就非常必要,这是CRM成功的基础。
SQLServer2005提供了数据平台整合性服务,即SSIS(SQLServer2000称之为DTS)。这是一个全新的企业级的数据抽取、转换和加载(ETL)平台,SSIS 使得企业能更容易地集成和分析来自多个异类数据源的数据,并且实现了对非传统数据(Web Services,XML)的支持。
3.建立模型及评估
SQLServer2005提供了9种数据挖掘算法。用于预测的算法包括线性回归,罗吉斯回归,时间序列,人工神经网络,用于分类的算法包括决策树,贝叶斯概率分类,此外,还有关联规则,聚集,文本挖掘。同一个商业问题,可以用几种算法解决,通过调整参数再从中选择一个最优方案。模型建立后,必须对模型检测和评估。在数据挖掘过程中,通常将数据集分为三部分:
(1)训练集:主要用来建立最初的挖掘模型。
(2)评估集: 对同一数据集可以建立不同挖掘模型,当各个模型建立后,则需要针对不同模型效果进行比较,评估集则是用来评估不同模型的执行效果。
(3)测试集:此数据集主要用于测试模型,并对模型进行修正。在数据挖掘建模过程中,建立、测试和评估模型是一种反复循环的程序,模型的效果会随着不同数据集而有异,因此模型建立完成后应加以测试。同一数据集可以采用不同挖掘算法建立不同的挖掘模型,对于不同模型的效果,也必须加以比较评估,选择最适合的挖掘模型。SQLServer2005提供的评估方法有:Mining Accuracy Chart,Lift Chart-累积增益图,Classification Matrix-错差矩阵。
4.模型的发布与整合
将挖掘的分析结果发布到商业模型中,达到自动化预测的效果,以提升营运利润、改善商业流程。CRM与企业资源计划(ERP),电子商务(EC),供应链管理(SCM)和其他遗产系统的集成将有利于把挖掘的分析结果进一步转换成企业经营管理实实在在可利用的信息。SQLServer2005提供了DMX、AMO 、XMLA等技术以及分析服务(Analysis Services)和报表服务(Reporting Services)。
四、结束语
构建基于SQLServer2005挖掘平台的CRM系统,重在应用,难在应用。一个企业要想使技术投资获得较高的收益,必须重视决策的效率和准确性问题。这是目前数据挖掘技术应用的薄弱环节。具体表现在:数据分析过程缺少方法论指导;数据挖掘过程与特定商业逻辑脱节;自动化和智能化程度低。因此,在应用数据挖掘技术的道路上,还有很多困难,难题等待我们去克服。
参考文献:
[1]Jiawei Han:数据挖掘概念与技术.机械工业出版社,2002.9出版
[2]Alex Berson:构建面向CRM的数据挖掘应用.人民邮电出版社,2001.8 出版
[3]张阿兰:数据挖掘任务之二:预测[J].中国统计.2004.1
[4]米天胜:数据仓库和数据挖掘在客户关系管理中的应用[J].情报技术,2006.9
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
[关键词] CRM 数据挖掘 SQLServer2005
一、前言
中小企业要想在激烈的市场竞争中谋生存求发展,就要努力提升自己的核心竞争力,从以往的“以产品为中心”的管理模式转变为“以客户为中心”的管理模式,这就需要构建客户关系管理系统(CRM)。数据库技术的成熟应用已使企业积累了大量的数据,管理层渴望从数据海洋里获得关于客户的准确的有价值的“知识”,利用这些“知识”实现客户细分,保持老客户,获得新客户。但是传统的数据库管理系统是面向应用的,只处理日常的经营业务,不具备智能数据处理的功能,如何获得这些“知识”就促成了数据挖掘技术的产生。反过来,数据挖掘技术的发展使构建智能化CRM系统成为可能。概括地讲,数据挖掘的任务是从数据仓库中提取人们感兴趣的,事先未知的,有用的或潜在有用的信息。
目前,国际上主流的数据挖掘工具有:SAS的Enterprise Miner;SPSS的Clementine;IBM的Intelligent Miner;Oracle的Darwin;Cognos的4Thought以及微软的SQLServer2005挖掘平台。选择什么样的数据挖掘工具,应该视企业的实际情况来定,功能最强的不一定是最合适的。考虑到中小企业CRM系统的以下特点:软件开发和维护成本相对低;功能不是很复杂;数据量不是很大;容易与其他系统集成等,SQLServer2005挖掘平台是最佳的选择。
二、CRM的体系结构
基础层为CRM系统提供Internet,Intranet,以及数据库,数据仓库,数据挖掘,联机分析处理(OLAP)和Web服务等软硬件技术支持。
操作层主要是提供以客户为中心的市场、销售、服务与支持等业务流程的自动化及扩展。包括销售力量自动化(Sales force Automation,SFA)、企业营销自动化(Enterprise Marketing Automation,EMA)、客户服务与支持(Customer Service&Support)三个基本模块。
分析层主要是利用数据挖掘技术,从共享的客户数据仓库中,提取有价值的信息,准确地了解客户行为、期望、需要、历史和与企业全面关系,为企业的战略决策服务。
协同层基于协同产品商务,协同性不仅体现在对客户信息的获得和跟踪方面,还强调在与客户进行的一系列业务中,内部人员之间及内部与外部之间的高效互通及协作。
三、SQLServer2005数据挖掘的流程
1.定义企业问题
確定目前企业遇到的问题。例如分析客户的流失情况,就要考虑这些问题:现有的客户哪些客户即将流失?现有客户他们的流失概率如何?哪些因素造成了客户的流失?不同类别之间客户的流失情况有什么差别?如果某个客户将要流失,他会在多长时间内流失?
2.数据准备
在企业信息化建设中,“三分技术,七分管理,十二分基础数据”,所以数据准备是最关键的一个环节。CRM在整个生命周期中,都以客户为中心,准确全面的客户信息是构建CRM系统的基石。为了进行有效的客户分析,这些信息必须在整个企业范围都是一致的,可靠的,并且具有统一的,便于使用的编码。然而,来源于历史上各个数据库的数据往往是异构的,不一致的,分散的,同时企业在收集客户信息的过程中,存在局部,片面,重复的现象,因此,建立一个企业范围内全局一致的客户数据仓库就非常必要,这是CRM成功的基础。
SQLServer2005提供了数据平台整合性服务,即SSIS(SQLServer2000称之为DTS)。这是一个全新的企业级的数据抽取、转换和加载(ETL)平台,SSIS 使得企业能更容易地集成和分析来自多个异类数据源的数据,并且实现了对非传统数据(Web Services,XML)的支持。
3.建立模型及评估
SQLServer2005提供了9种数据挖掘算法。用于预测的算法包括线性回归,罗吉斯回归,时间序列,人工神经网络,用于分类的算法包括决策树,贝叶斯概率分类,此外,还有关联规则,聚集,文本挖掘。同一个商业问题,可以用几种算法解决,通过调整参数再从中选择一个最优方案。模型建立后,必须对模型检测和评估。在数据挖掘过程中,通常将数据集分为三部分:
(1)训练集:主要用来建立最初的挖掘模型。
(2)评估集: 对同一数据集可以建立不同挖掘模型,当各个模型建立后,则需要针对不同模型效果进行比较,评估集则是用来评估不同模型的执行效果。
(3)测试集:此数据集主要用于测试模型,并对模型进行修正。在数据挖掘建模过程中,建立、测试和评估模型是一种反复循环的程序,模型的效果会随着不同数据集而有异,因此模型建立完成后应加以测试。同一数据集可以采用不同挖掘算法建立不同的挖掘模型,对于不同模型的效果,也必须加以比较评估,选择最适合的挖掘模型。SQLServer2005提供的评估方法有:Mining Accuracy Chart,Lift Chart-累积增益图,Classification Matrix-错差矩阵。
4.模型的发布与整合
将挖掘的分析结果发布到商业模型中,达到自动化预测的效果,以提升营运利润、改善商业流程。CRM与企业资源计划(ERP),电子商务(EC),供应链管理(SCM)和其他遗产系统的集成将有利于把挖掘的分析结果进一步转换成企业经营管理实实在在可利用的信息。SQLServer2005提供了DMX、AMO 、XMLA等技术以及分析服务(Analysis Services)和报表服务(Reporting Services)。
四、结束语
构建基于SQLServer2005挖掘平台的CRM系统,重在应用,难在应用。一个企业要想使技术投资获得较高的收益,必须重视决策的效率和准确性问题。这是目前数据挖掘技术应用的薄弱环节。具体表现在:数据分析过程缺少方法论指导;数据挖掘过程与特定商业逻辑脱节;自动化和智能化程度低。因此,在应用数据挖掘技术的道路上,还有很多困难,难题等待我们去克服。
参考文献:
[1]Jiawei Han:数据挖掘概念与技术.机械工业出版社,2002.9出版
[2]Alex Berson:构建面向CRM的数据挖掘应用.人民邮电出版社,2001.8 出版
[3]张阿兰:数据挖掘任务之二:预测[J].中国统计.2004.1
[4]米天胜:数据仓库和数据挖掘在客户关系管理中的应用[J].情报技术,2006.9
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文