论文部分内容阅读
进入信息时代,数据出现爆炸式的增长,在大量的数据中找到并处理所感兴趣的数据是一项具有挑战性的任务,而这一点对企业的管理者来说尤为重要。数据挖掘技术在一定程度上满足了人们的这种需求。数据挖掘技术可以按照企业既定的业务目标自动地从数据库中提取出用以辅助企业决策的相关模式,对于它的研究是当前学术界和信息产业界的一个热门。客户关系管理(Customer Relation Management,即CRM)是一项商业运行策略,通过选择和管理客户达到最大的长期价值,是以客户为中心来支持有效的市场推广。CRM是将客户信息转化成为积极的客户关系的反复循环过程,而数据挖掘则是从大量数据中提取有用知识的有力工具,数据挖掘技术在CRM中的应用主要体现在:数据挖掘技术可以从与客户有关的大量数据中挖掘出对企业经营决策有价值的知识和规则。
本文从CRM的需求入手,在分析了数据挖掘的基本原理和技术后,重点讨论了在CRM中应用决策树进行客户分类的问题。为了实现CRM中对客户的分类,本文详细阐述了并改进了数据挖掘中常用的算法,针对C4.5决策树分类挖掘算法,分析了原算法构造的决策树可能过大,导致用户难以理解和解释,为了限制决策树的大小,对原C4.5算法提出了一种改进思路。通过输入决策树的最大节点数参数,构造适当大小的树。本文还将支持向量机引入到径向基神经网络中,提高了神经网络的预测能力。对于数据挖掘中的突发检测问题,本文也提出了用改进的贪婪算法来检测突发事件。本文在将数据挖掘技术用于CRM客户管理中,做了以下的工作:将C4.5算法、Apriori算法、神经网络等算法用于Acme数据库,通过计算特定属性的信息增益,并建立初级决策树,通过枝剪,合并从而得到一些感兴趣的模式,这些模式对企业的经营策略有重要导向作用。
本文从CRM的需求入手,在分析了数据挖掘的基本原理和技术后,重点讨论了在CRM中应用决策树进行客户分类的问题。为了实现CRM中对客户的分类,本文详细阐述了并改进了数据挖掘中常用的算法,针对C4.5决策树分类挖掘算法,分析了原算法构造的决策树可能过大,导致用户难以理解和解释,为了限制决策树的大小,对原C4.5算法提出了一种改进思路。通过输入决策树的最大节点数参数,构造适当大小的树。本文还将支持向量机引入到径向基神经网络中,提高了神经网络的预测能力。对于数据挖掘中的突发检测问题,本文也提出了用改进的贪婪算法来检测突发事件。本文在将数据挖掘技术用于CRM客户管理中,做了以下的工作:将C4.5算法、Apriori算法、神经网络等算法用于Acme数据库,通过计算特定属性的信息增益,并建立初级决策树,通过枝剪,合并从而得到一些感兴趣的模式,这些模式对企业的经营策略有重要导向作用。