论文部分内容阅读
随着各个行业的发展都面临着转变经济发展方式的大趋势问题,烟草行业由于其自身的特殊性也面临着越来越多的问题,提高客户的满意度则成为目前工作的重心,采用先进的分类方法对客户进行细分,从而对不同的客户提供差异性的服务,是提高满意度的重要手段。 本文运用数据挖掘专业软件SAS,运用其专业的数据挖掘平台SASEM,以某烟草公司的卷烟批发数据为数据源。首先对运用SAS系统本身强大的查询功能数据进行预处理,经过数据查询、数据变换以及增加统计字段等步骤,从原始变量中得到目标变量,最终处理为可以进行数据挖掘的数据;第二步,建立RFM模型运用聚类的方法对客户进行细分,通过对批发次数、批发间隔时间、批发总金额进行聚类分析得到细分的结果。客户被分成七类,即:“VIP客户”、“重要客户”、“比较重要客户”、“重要普通客户”、“特殊普通客户”、“小客户”、“低端客户”,分类完成后,通过数据挖掘和分析,分析这七类客户的差异,以及根据不同的客户给出相应的营销策略。由于“VIP客户”与“小客户”的特殊性与贡献性,因此分析这两组具体的批发行为。聚类分析能够很好的将数据分成几类,但聚类分析存在的问题是,聚类分析只是将数据分成几类,而类标记没有实际意义,所以需要人为的进行解释说明,聚类方法不能应用到其他数据集。 本文最后将聚类结果数据分成训练集和验证集,利用决策树进行划分,通过误差率等评价标准,检验划分规则效果,利用生成的决策树的规则,对相似数据集进行分类。