论文部分内容阅读
摘 要:本文简要地阐述了客户细分的特点,总结了电力行业客户细分存在的问题,从中针对数据挖掘的电力客户细分模型构建进行了研究,最后结合工程实例加以论述,旨在为同行提供参考与借鉴。
关键词:数据挖掘;电力行业;客户细分;问题;构建
引言
近年来,随着电力行业的不断发展,电力企业思想也在不断的改变,在具体的工作中在不断地反思改革,目的是更好的推动企业前行,使整个行业更好的前行。电力行业服务的是客户,客户来自于社会的各个部分,有着不同的需求,有着不同经济基础,所以我们的客户戏份工作要更加的细致,更加的有条理,为后续工作开辟好的指引。鉴于此,本文结合工作实践,主要就数据挖掘的电力行业客户细分及建模进行了研究。
1 客户细分的概述
客户细分的前提是根据企业收集与整理的客户信息,结合其需求特点、信誉状况及购买行为等方面的不同,将某种产品的客户分到多个客户群当中。因此,不同的细分客户群体具有不同的特征,其客户需求也各不相同。客户细分立足于多种不同客户特点基础上,根据不同的企业客户对产品的需求,才能进行细分。同时,随着经济市场改革的日趋成熟,客户对产品的特点也是随之改变的,而客户细分也会随着其发生改变。因此,企业要密切关注客户的实际情况,以采取及时、有效的细分对策。在客户细分实际的应用中,体现的是一个聚集的过程,即企业根据客户的需求,将相同需求特点的客户归为一个群体。
2 电力行业客户细分存在的问题分析
我国旧的细分方式有很多的弊端存在,例如我们常见的客户的细分行为缺失、细分的方式较单一、具体行为操作的过程不规范等等问题,这些问题大大的影响了健康有序的发展。对于现阶段我国的基本情况,用户的组成的板块较多,对于需求的也是十分的不同,在各个不同的用电需求之间穿插着,为供电提供了很大的难度。就拿工业用电为例吧,在大的工业园区,会有很多的企业在使用电力资源,我们是知道的可能由于产能的不同以及公司的规模的不同每月的耗电量也不同我们在工业用电的标准就没充分的考虑到这一点,而是只有一个供电标准,一个电费的收取价格,如果进行阶梯式收取,企业会更加节省合理的利用电能。现阶段还有很多的弊端存在,需要我们慢慢地去完善以便达到各方面的满意,企业的进步。
3 数据挖掘的电力客户细分模型构建
3.1 细分模型设计思路
数据挖掘客户细分模型设计的思路主要包括:结合不同的客户行为属性,不断优化客户细分指标体系;在客户价值评价上进行客户价值描述体系的构建;以客户行为细分为主的思路进行客户细分模型的构建。
3.2 细分原则
电力企业在进行客户细分的过程中应遵循以下原则:第一,可衡量性。也就是企业在进行客户需要信息、数据的收集及调研中能进行合理的衡量,并明确各个细分市场的范围无论是市场的规模大小,还是需求量都要進行衡量。第二,可进入性。电力企业的资源条件及营销能力可体现在子市场中。第三,可盈利性。细分后客户购买力及子市场规模能满足企业盈利的最大化。第四,反应差异。在各个子市场对市场营销组合中因素变动的情况下,都正确及时作出差异性反应等。
3.3 细分方法
在经济市场各个领域当中,大多都是采取K-means算法进行客户细分。该算法是一种划分的,但并非分层的聚类方法,是由Mac?Quen最先提出的,目前在数据挖掘领域中应用越来越广泛。
3.4 基于数据挖掘的总体模型设计
功能、数据及方法三方面作为主要的数据挖掘电力客户细分功能结构模型。其中功能部分不仅是模型设计的目标以及设计的结果,其功能部分主要包括:客户分析、客户分类、市场预测、定向服务、辅助营销等功能。在长期的数据挖掘中,市场功能的不同在选择细分方法,会导致数据出现相当大的差异性。数据模块是总体模型的基础,进行充分的数据准备及预处理,才能真正保证产生真实性、有效性。而客户维度的选择及明确度量是保证取得满意客户细分结果的前提,而方法模块则是总体模型中的核心。电力大客户细分功能结构模型,如图1所示。
3.5 基于Kmeans算法的模型设计
数据挖掘技术涉及的领域相当广泛,包括:计算机软件、统计学、数学、人工智能理论等,包含丰富的理论知识,采取各种科学技术。因此,数据挖掘技术的成功应用具有重要的设计意义。而数据挖掘模型则是该应用方法的研究成果。通过研究K-means算法的原理、特点,遵循相关的处理流程,客户细分模型框架,如图2所示。
从K-means算法的工作过程中可以看出:先是从n个数据中任意选出k个数据对象作为初始的聚类点;其次是根据所剩下数据对象和这些聚类点之间的聚类,把它们相应分配到与其相似值最高的聚类中心;最后进行各个新聚类的聚类中心的计算,精确求出该聚类中数据对象的平均值,进行循环渐进的重复计算,直到计算出准确的准则函数。K-means算法可采取准则函数:
式中:E为数据库中全部数据对象平均误差的总和;p为空间的点;mi为簇Ci的平值,而p与mi均属于多维的。其准则的根本目标在于:强化生成的结构簇的紧密型;k作为Kmeans算法参数,可将n个数据对象分成k簇,不断增强簇内的相似度,从而降低簇间的相似度。Kmeans算法作为一种时效性的算法,可综合分析聚类问题,其算法具有显著的简单性、精确性、高效性,可集中处理大数据库等。
4 算例分析
本文选取南方电网某省电网公司的大客户进行分析,按照年用电量1200万kW·h及以上的大客户定义,2012 年该省电网公司共有大客户2135 户,主要是非金属矿物制品业、炼钢和通用及专用设备 制造业等行业。
4.1 数据提取与整理
以某省2135户大客户为对象,根据客户细分指标体系中各项指标所对应的细分变量,提取包含 大客户基本信息、用电量信息、缴欠费信息、违约违章信息、业务办理信息及渠道沟通信息等数据字段 233个,并对数据进行二次计算、清洗等预处理。 4.2 建模因素筛选
由于采用的是聚类的数据挖掘方法,需要排除字段中的离散型变量、区分度不大或缺失值较高的 字段以及非业务重点关注字段,并计算字段之间的相关性,确保高相关性的字段只选择一个。利用因 子分析方法,对细分变量进行筛选,最终选定了16个用于建模的字段,如表1所示。
4.3 运用聚类算法建模
对2135户大客户的16项建模字段数据进行标准化处理,以平衡各个字段对距离计算的影响。采用 K-means聚类算法进行建模计算,得到5个大客户细分群: 生产波动型、交互活跃型、业务扩张型、相对沉默型和重点关注型,如图3所示。
主要特征如下: ①生产波动型: 共有755户大客户,客户生产情况存在波动,对暂停及暂停恢复业务需求相对较多,在缴费上倾向去营业厅通过现金、支票等方式。主要行业为非金属矿物制品业、炼钢和贵金属冶炼。②交互活跃型: 共有197户大客户,属于特别活跃的大客户群体,从95598拨打次数、网上营业厅登陆次数反映出较强的沟通行为。主要行业为非金属矿物制品业、通用及专用设备制造业和炼钢。③业务扩张型: 共有170户大客户,经营状況势头良好,对高压增容业务需求量较大,供电可靠性要求较高,但功率因数不达标次数较多。主要行业为非金属矿物制品业、通用及专用设备制造业、炼钢和贵金属冶炼。④相对沉默型: 共有606户大客户,属于相对沉默的大客户群,在缴费方式上倾向于通过银行代扣、自助终端等方式。主要行业为非金属矿物制品业、炼钢、全社会用电和水泥制造业。⑤重点关注型: 共有407户大客户,历史上发生过多次欠费和用检不合格行为,主要行业为非金属矿物制品业、炼钢和通用及专用设备制造业。
5 结束语
综上所述,基于数据挖掘的客户细分具有提高细分合理性、指导营销活动及可操作性强等优点,可以有效解决电力客户细分中存在的问题。综上所述,对于数据挖掘的电力行业客户细分模型研究能为电力企业对不同类型的客户进行准确、合理的细分,能为电力企业的营销决策提供科学、可行的信息支持,对提高电力企业的经济效益及社会效益具有重要的意义。
参考文献
[1]王松涛.市场条件下的电力客户价值分析体系[J].电网技术,2010,34(2):155-158
[2]王扶东.芳基于数据挖掘的客户细分方法的研究[J].计算机工程与运用,2011,47(4):215-218.
关键词:数据挖掘;电力行业;客户细分;问题;构建
引言
近年来,随着电力行业的不断发展,电力企业思想也在不断的改变,在具体的工作中在不断地反思改革,目的是更好的推动企业前行,使整个行业更好的前行。电力行业服务的是客户,客户来自于社会的各个部分,有着不同的需求,有着不同经济基础,所以我们的客户戏份工作要更加的细致,更加的有条理,为后续工作开辟好的指引。鉴于此,本文结合工作实践,主要就数据挖掘的电力行业客户细分及建模进行了研究。
1 客户细分的概述
客户细分的前提是根据企业收集与整理的客户信息,结合其需求特点、信誉状况及购买行为等方面的不同,将某种产品的客户分到多个客户群当中。因此,不同的细分客户群体具有不同的特征,其客户需求也各不相同。客户细分立足于多种不同客户特点基础上,根据不同的企业客户对产品的需求,才能进行细分。同时,随着经济市场改革的日趋成熟,客户对产品的特点也是随之改变的,而客户细分也会随着其发生改变。因此,企业要密切关注客户的实际情况,以采取及时、有效的细分对策。在客户细分实际的应用中,体现的是一个聚集的过程,即企业根据客户的需求,将相同需求特点的客户归为一个群体。
2 电力行业客户细分存在的问题分析
我国旧的细分方式有很多的弊端存在,例如我们常见的客户的细分行为缺失、细分的方式较单一、具体行为操作的过程不规范等等问题,这些问题大大的影响了健康有序的发展。对于现阶段我国的基本情况,用户的组成的板块较多,对于需求的也是十分的不同,在各个不同的用电需求之间穿插着,为供电提供了很大的难度。就拿工业用电为例吧,在大的工业园区,会有很多的企业在使用电力资源,我们是知道的可能由于产能的不同以及公司的规模的不同每月的耗电量也不同我们在工业用电的标准就没充分的考虑到这一点,而是只有一个供电标准,一个电费的收取价格,如果进行阶梯式收取,企业会更加节省合理的利用电能。现阶段还有很多的弊端存在,需要我们慢慢地去完善以便达到各方面的满意,企业的进步。
3 数据挖掘的电力客户细分模型构建
3.1 细分模型设计思路
数据挖掘客户细分模型设计的思路主要包括:结合不同的客户行为属性,不断优化客户细分指标体系;在客户价值评价上进行客户价值描述体系的构建;以客户行为细分为主的思路进行客户细分模型的构建。
3.2 细分原则
电力企业在进行客户细分的过程中应遵循以下原则:第一,可衡量性。也就是企业在进行客户需要信息、数据的收集及调研中能进行合理的衡量,并明确各个细分市场的范围无论是市场的规模大小,还是需求量都要進行衡量。第二,可进入性。电力企业的资源条件及营销能力可体现在子市场中。第三,可盈利性。细分后客户购买力及子市场规模能满足企业盈利的最大化。第四,反应差异。在各个子市场对市场营销组合中因素变动的情况下,都正确及时作出差异性反应等。
3.3 细分方法
在经济市场各个领域当中,大多都是采取K-means算法进行客户细分。该算法是一种划分的,但并非分层的聚类方法,是由Mac?Quen最先提出的,目前在数据挖掘领域中应用越来越广泛。
3.4 基于数据挖掘的总体模型设计
功能、数据及方法三方面作为主要的数据挖掘电力客户细分功能结构模型。其中功能部分不仅是模型设计的目标以及设计的结果,其功能部分主要包括:客户分析、客户分类、市场预测、定向服务、辅助营销等功能。在长期的数据挖掘中,市场功能的不同在选择细分方法,会导致数据出现相当大的差异性。数据模块是总体模型的基础,进行充分的数据准备及预处理,才能真正保证产生真实性、有效性。而客户维度的选择及明确度量是保证取得满意客户细分结果的前提,而方法模块则是总体模型中的核心。电力大客户细分功能结构模型,如图1所示。
3.5 基于Kmeans算法的模型设计
数据挖掘技术涉及的领域相当广泛,包括:计算机软件、统计学、数学、人工智能理论等,包含丰富的理论知识,采取各种科学技术。因此,数据挖掘技术的成功应用具有重要的设计意义。而数据挖掘模型则是该应用方法的研究成果。通过研究K-means算法的原理、特点,遵循相关的处理流程,客户细分模型框架,如图2所示。
从K-means算法的工作过程中可以看出:先是从n个数据中任意选出k个数据对象作为初始的聚类点;其次是根据所剩下数据对象和这些聚类点之间的聚类,把它们相应分配到与其相似值最高的聚类中心;最后进行各个新聚类的聚类中心的计算,精确求出该聚类中数据对象的平均值,进行循环渐进的重复计算,直到计算出准确的准则函数。K-means算法可采取准则函数:
式中:E为数据库中全部数据对象平均误差的总和;p为空间的点;mi为簇Ci的平值,而p与mi均属于多维的。其准则的根本目标在于:强化生成的结构簇的紧密型;k作为Kmeans算法参数,可将n个数据对象分成k簇,不断增强簇内的相似度,从而降低簇间的相似度。Kmeans算法作为一种时效性的算法,可综合分析聚类问题,其算法具有显著的简单性、精确性、高效性,可集中处理大数据库等。
4 算例分析
本文选取南方电网某省电网公司的大客户进行分析,按照年用电量1200万kW·h及以上的大客户定义,2012 年该省电网公司共有大客户2135 户,主要是非金属矿物制品业、炼钢和通用及专用设备 制造业等行业。
4.1 数据提取与整理
以某省2135户大客户为对象,根据客户细分指标体系中各项指标所对应的细分变量,提取包含 大客户基本信息、用电量信息、缴欠费信息、违约违章信息、业务办理信息及渠道沟通信息等数据字段 233个,并对数据进行二次计算、清洗等预处理。 4.2 建模因素筛选
由于采用的是聚类的数据挖掘方法,需要排除字段中的离散型变量、区分度不大或缺失值较高的 字段以及非业务重点关注字段,并计算字段之间的相关性,确保高相关性的字段只选择一个。利用因 子分析方法,对细分变量进行筛选,最终选定了16个用于建模的字段,如表1所示。
4.3 运用聚类算法建模
对2135户大客户的16项建模字段数据进行标准化处理,以平衡各个字段对距离计算的影响。采用 K-means聚类算法进行建模计算,得到5个大客户细分群: 生产波动型、交互活跃型、业务扩张型、相对沉默型和重点关注型,如图3所示。
主要特征如下: ①生产波动型: 共有755户大客户,客户生产情况存在波动,对暂停及暂停恢复业务需求相对较多,在缴费上倾向去营业厅通过现金、支票等方式。主要行业为非金属矿物制品业、炼钢和贵金属冶炼。②交互活跃型: 共有197户大客户,属于特别活跃的大客户群体,从95598拨打次数、网上营业厅登陆次数反映出较强的沟通行为。主要行业为非金属矿物制品业、通用及专用设备制造业和炼钢。③业务扩张型: 共有170户大客户,经营状況势头良好,对高压增容业务需求量较大,供电可靠性要求较高,但功率因数不达标次数较多。主要行业为非金属矿物制品业、通用及专用设备制造业、炼钢和贵金属冶炼。④相对沉默型: 共有606户大客户,属于相对沉默的大客户群,在缴费方式上倾向于通过银行代扣、自助终端等方式。主要行业为非金属矿物制品业、炼钢、全社会用电和水泥制造业。⑤重点关注型: 共有407户大客户,历史上发生过多次欠费和用检不合格行为,主要行业为非金属矿物制品业、炼钢和通用及专用设备制造业。
5 结束语
综上所述,基于数据挖掘的客户细分具有提高细分合理性、指导营销活动及可操作性强等优点,可以有效解决电力客户细分中存在的问题。综上所述,对于数据挖掘的电力行业客户细分模型研究能为电力企业对不同类型的客户进行准确、合理的细分,能为电力企业的营销决策提供科学、可行的信息支持,对提高电力企业的经济效益及社会效益具有重要的意义。
参考文献
[1]王松涛.市场条件下的电力客户价值分析体系[J].电网技术,2010,34(2):155-158
[2]王扶东.芳基于数据挖掘的客户细分方法的研究[J].计算机工程与运用,2011,47(4):215-218.