论文部分内容阅读
【摘要】增值业务是运营商提供给消费者的更高层次的信息需求,增值业务用户规模庞大,业务种类多需要及时监测核心业务的发展动态,有效支撑到数据业务精确营销:能按条件提取用户号码集的目标营销能力、及时检验数据业务的营销效果。实现数据业务客户分群管理、支撑数据业务的门户管理与优化。所有这些功能的实现,都要求发现众多数据中存在的关系和规则,根据现有的数据预测未来的发展趋势,提高准确辨识、获取、保持和增加数据业务"可获利客户"能力, 改善数据业务客户关系、互动方式、资源调配、业务流程和自动化程度。因此, 此文从数据挖掘的流程、技术实现,及深度运营支撑中的应用进行介绍。
【关键词】数据挖掘;增值业务;深度运营
1、数据挖掘流程及技术实现
数据挖掘涉及多学科技术的集成,包括数据库技术、统计学、机器学习、高性能计算、模式识别、数据可视化、信息检索等,常用算法有人工神经网络、遗传算法、决策树算法、聚类算法、粗糙集方法等。
数据挖掘大致经过取得数据源、数据预处理、构造和训练模型及评价模型几个过程,具体步骤如下:
(1)问题定义。进行数据挖掘,首先必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的有关情况,熟悉背景知识,弄清用户需求。缺少背景知识,就不能明确定义要解决的问题,就不能为挖掘准备优质的数据,也很难正确解释得到的结果。清晰明确地了解用户的目标,清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。
(2)选择合适的数据挖掘工具。如果经过上一步的分析发现,存在的问题能用数据挖掘比较好地解决,那么第二步就是选择合适的数据挖掘技术与方法。
(3)数据准备。解决数据的应用质量问题是数据挖掘的基础。数据准备包含两方面:一是从多个数据源去整合数据挖掘所需要的数据,保证数据的综合性、易用性、數据的质量和数据的实效性;另一方面就是如何从现有数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。
(4)建立模型。数据挖掘的目的就是建立一个现实世界的模型。在问题进一步明确,数据结构和内容进一步调整的基础上,就可以形成知识的模型。一个好的模型没必要与已有数据完全相符,但模型对未来的数据应有较好的预测。需要仔细考察不同的模型以判断哪个模型对所需解决的问题最有用。这一步是数据挖掘的核心环节。
(5)模式评估。对数据挖掘的结果需要进行评估,确定数据挖掘是否存在偏差,挖掘结果是否正确,确定哪些是有效的、有用的模式,是否满足用户的需求。模式评估将发现的知识以用户能了解的方式呈现,根据需要对数据挖掘过程中的某些处理阶段进行优化,直到满足要求。
(6)数据可视化和知识管理。数据可视化指的是将数据或数据挖掘的结果以图形或图像的形式显示出来,使知识发现的过程能够被用户理解。数据挖掘过程的可视化有助于数据挖掘结果的表示,使用户更直观地查看数据挖掘的结果。知识管理指的是对数据挖掘得到的结果进行分析。
2、数据挖掘在增值业务深度运营平台中的应用
我们所服务的客户是国内某电信运营商,在前几年就着手建立自己的数据仓库, 相对于其它领域历史数据比较规范,但数据量相当大,为满足客户需求,推出了越来越多的目标客户营销活动,面对如此众多的营销活动,其管理的工作量非常巨大,营销活动从设计、执行到评估等各个环节需要多个部门协作才能完成,很多工作主要依靠手工实现,如提取活动目标客户名单,收集活动监控数据等,不仅耗费大量人力和时间,并且较难达到营销方案管理的延续性和体系性。随着3G时代的到来,业务种类将更为繁多、复杂,传统手工进行营销方案的管理将愈加困难。根据科学的业务流程设计,实现对营销活动事前分析、事中监控、事后评估的电子化闭环管理。营销管理包括四个过程:市场分析、营销策划、营销执行、评估优化。而每一个过程我们需要设计多个数据分析(挖掘)应用模型来支撑。
(1)目标客户筛选
目标客户是指具体某个营销活动针对的客户群体。客户筛选是营销策划人员通过设定业务营销条件,经过系统分析,确定营销活动的客户清单列表和潜在客户的特征描述。
客户筛选主要是体现客户的精细化营销,提高营销的准确度,降低营销成本,提高营销效果。在营销结束后可以收集这些客户的接受行为信息,对营销条件设定的合理性进行评估,将条件以模板方式保存,作为以后类似特征的营销活动目标客户确定提供历史参考。
(2)营销渠道选择
营销渠道选择是指营销策划人员在做具体营销方案时确定营销活动实施的渠道信息。营销渠道即包括实体营业厅、网上营业厅、客服中心、大客户经理、集团客户经理等传统渠道,也包括短信平台、彩信平台、WAP等电子渠道。可以分析各个渠道的信息,可以对每一个细分群组定义营销活动规则,主要包括以下内容:客户接触方式:采用什么方式对客户进行营销,包括:客户经理,电子渠道,自有渠道,合作伙伴,客户接触时间,接触人数。
(3)关联分析模型建模需求
关联分析是数据挖掘技术的一个典型的分析工具,旨在发现商业关系中的关联规则。在维护和优化客户关系这一层面上,关联分析工具主要应用于寻找和发掘客户使用的产品或者服务之间的关系,从而达到个性化营销的目的。作为交叉销售主题的一个延续环节,本主题应用关联分析工具,帮助解决在个性化营销过程中的如下关键问题。
(4)增量预测模型的建模需求
增量预测模型主要应用在急需扩大用户规模的业务上,即从当前使用该业务的用户特征,延伸到当前大量的未使用该业务的用户群上,在大量的未使用该业务的用户中寻找到最可能使用该业务的潜在用户。比如过去广东公司所开展的彩信增量销售模型、彩铃增量销售模型均是增量预测模型的典型应用。如2007年还可以继续用在某增值业务的增量预测。
(5)客户流失分析
在电信企业面向市场、面向国内外众多的竞争者、努力创造更高价值的同时,客户流失的不断增加和客户平均生命周期的不断缩短严重影响了电信企业的发展。在激烈的市场竞争和不断变化的市场需求面前,必须最大限度地降低客户的流失率。利用已经拥有的客户流失数据建立客户属性、服务属性和客户消费数据等与客户流失可能相关联的数据,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,只要掌握了新的这类数据,就可以建立客户流失预测模型,可以用分类、同归、关联、聚类等方法建模,用于挽留有很大可能流失的客户。
(6)客户细分
利用数据挖掘可以把大量的客户分成不同的类,在每个类里的客户拥有近似的属性,不同类里的客户属性不同。细分可以让一个用户从比较高的层次上来查看整个数据库中的数据,细分也使得人们可以用不同的方法对待处于不同细分中的客户。有多种方式可以在细分上运用数据挖掘,通常用来建立细分群的数据挖掘方法是聚类方法和分类中的决策树方法。
(7)交叉销售
交叉销售是指向现有的客户提供新的产品和服务的营销过程,那些购买了某种产品和服务的客户很有可能同时购买你能提供的某些他感兴趣的相关产品和服务。另外一种形式就是"升级销售",即向客户提供与他们已购买的服务相关的增值服务。例如,电信公司向已经使用标准长途电话服务的客户推销优质长途电话服务。它是建立在双赢原则上的,对客户来讲,要得到更多更好满足需求的服务且从中受益,对企业来讲,也会因销售额的增长而获益。
(8)欺诈行为分析
通过数据挖掘算法,分析各种骗费、欠费用户的性质和消费行为,建立一套欺诈欠费行为的规则库。当客户的话费行为与规则库中规则吻合时,系统可以提示运营商相关部门采取措施,预测可能的欺诈用户,从而降低运营商的损失风险。一般流程是根据挖掘算法,如聚类算法、分类算法、关联规则和线性回归等生成挖掘模型,然后应用挖掘模型对相关数据进行挖掘,最终得到需要的挖掘结果,也就是电信欺诈侦测模型。
(9)市场分析
数据挖掘在市场分析中的应用包括市场推广分析、市场特点分析和业务趋势预测等。通过回归分析算法可以预测发展趋势最快的业务,从而决定业务重点和发展趋势。客户市场推广分析(如优惠策略预测仿真)是利用数据挖掘技术实现优惠策略的仿真,根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优惠策略中存在的问题,并进行相应的调整优化,以达到优惠促销活动的收益最大化。
(10)网络告警分析
在电信网中每天都会产生大量的告警数据,在这些数据中隐藏着很多有价值的信息。这些信息可以用来过滤冗余的告警,在网络中进行故障定位和预测严重的错误。但这些信息是隐藏在数据中的,通过数据挖掘才能获得。在告警数据中可挖掘出不同类型的知识,例如神经网络、危险模式和规则发现等。
责任编辑:王利强
【关键词】数据挖掘;增值业务;深度运营
1、数据挖掘流程及技术实现
数据挖掘涉及多学科技术的集成,包括数据库技术、统计学、机器学习、高性能计算、模式识别、数据可视化、信息检索等,常用算法有人工神经网络、遗传算法、决策树算法、聚类算法、粗糙集方法等。
数据挖掘大致经过取得数据源、数据预处理、构造和训练模型及评价模型几个过程,具体步骤如下:
(1)问题定义。进行数据挖掘,首先必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的有关情况,熟悉背景知识,弄清用户需求。缺少背景知识,就不能明确定义要解决的问题,就不能为挖掘准备优质的数据,也很难正确解释得到的结果。清晰明确地了解用户的目标,清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。
(2)选择合适的数据挖掘工具。如果经过上一步的分析发现,存在的问题能用数据挖掘比较好地解决,那么第二步就是选择合适的数据挖掘技术与方法。
(3)数据准备。解决数据的应用质量问题是数据挖掘的基础。数据准备包含两方面:一是从多个数据源去整合数据挖掘所需要的数据,保证数据的综合性、易用性、數据的质量和数据的实效性;另一方面就是如何从现有数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。
(4)建立模型。数据挖掘的目的就是建立一个现实世界的模型。在问题进一步明确,数据结构和内容进一步调整的基础上,就可以形成知识的模型。一个好的模型没必要与已有数据完全相符,但模型对未来的数据应有较好的预测。需要仔细考察不同的模型以判断哪个模型对所需解决的问题最有用。这一步是数据挖掘的核心环节。
(5)模式评估。对数据挖掘的结果需要进行评估,确定数据挖掘是否存在偏差,挖掘结果是否正确,确定哪些是有效的、有用的模式,是否满足用户的需求。模式评估将发现的知识以用户能了解的方式呈现,根据需要对数据挖掘过程中的某些处理阶段进行优化,直到满足要求。
(6)数据可视化和知识管理。数据可视化指的是将数据或数据挖掘的结果以图形或图像的形式显示出来,使知识发现的过程能够被用户理解。数据挖掘过程的可视化有助于数据挖掘结果的表示,使用户更直观地查看数据挖掘的结果。知识管理指的是对数据挖掘得到的结果进行分析。
2、数据挖掘在增值业务深度运营平台中的应用
我们所服务的客户是国内某电信运营商,在前几年就着手建立自己的数据仓库, 相对于其它领域历史数据比较规范,但数据量相当大,为满足客户需求,推出了越来越多的目标客户营销活动,面对如此众多的营销活动,其管理的工作量非常巨大,营销活动从设计、执行到评估等各个环节需要多个部门协作才能完成,很多工作主要依靠手工实现,如提取活动目标客户名单,收集活动监控数据等,不仅耗费大量人力和时间,并且较难达到营销方案管理的延续性和体系性。随着3G时代的到来,业务种类将更为繁多、复杂,传统手工进行营销方案的管理将愈加困难。根据科学的业务流程设计,实现对营销活动事前分析、事中监控、事后评估的电子化闭环管理。营销管理包括四个过程:市场分析、营销策划、营销执行、评估优化。而每一个过程我们需要设计多个数据分析(挖掘)应用模型来支撑。
(1)目标客户筛选
目标客户是指具体某个营销活动针对的客户群体。客户筛选是营销策划人员通过设定业务营销条件,经过系统分析,确定营销活动的客户清单列表和潜在客户的特征描述。
客户筛选主要是体现客户的精细化营销,提高营销的准确度,降低营销成本,提高营销效果。在营销结束后可以收集这些客户的接受行为信息,对营销条件设定的合理性进行评估,将条件以模板方式保存,作为以后类似特征的营销活动目标客户确定提供历史参考。
(2)营销渠道选择
营销渠道选择是指营销策划人员在做具体营销方案时确定营销活动实施的渠道信息。营销渠道即包括实体营业厅、网上营业厅、客服中心、大客户经理、集团客户经理等传统渠道,也包括短信平台、彩信平台、WAP等电子渠道。可以分析各个渠道的信息,可以对每一个细分群组定义营销活动规则,主要包括以下内容:客户接触方式:采用什么方式对客户进行营销,包括:客户经理,电子渠道,自有渠道,合作伙伴,客户接触时间,接触人数。
(3)关联分析模型建模需求
关联分析是数据挖掘技术的一个典型的分析工具,旨在发现商业关系中的关联规则。在维护和优化客户关系这一层面上,关联分析工具主要应用于寻找和发掘客户使用的产品或者服务之间的关系,从而达到个性化营销的目的。作为交叉销售主题的一个延续环节,本主题应用关联分析工具,帮助解决在个性化营销过程中的如下关键问题。
(4)增量预测模型的建模需求
增量预测模型主要应用在急需扩大用户规模的业务上,即从当前使用该业务的用户特征,延伸到当前大量的未使用该业务的用户群上,在大量的未使用该业务的用户中寻找到最可能使用该业务的潜在用户。比如过去广东公司所开展的彩信增量销售模型、彩铃增量销售模型均是增量预测模型的典型应用。如2007年还可以继续用在某增值业务的增量预测。
(5)客户流失分析
在电信企业面向市场、面向国内外众多的竞争者、努力创造更高价值的同时,客户流失的不断增加和客户平均生命周期的不断缩短严重影响了电信企业的发展。在激烈的市场竞争和不断变化的市场需求面前,必须最大限度地降低客户的流失率。利用已经拥有的客户流失数据建立客户属性、服务属性和客户消费数据等与客户流失可能相关联的数据,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,只要掌握了新的这类数据,就可以建立客户流失预测模型,可以用分类、同归、关联、聚类等方法建模,用于挽留有很大可能流失的客户。
(6)客户细分
利用数据挖掘可以把大量的客户分成不同的类,在每个类里的客户拥有近似的属性,不同类里的客户属性不同。细分可以让一个用户从比较高的层次上来查看整个数据库中的数据,细分也使得人们可以用不同的方法对待处于不同细分中的客户。有多种方式可以在细分上运用数据挖掘,通常用来建立细分群的数据挖掘方法是聚类方法和分类中的决策树方法。
(7)交叉销售
交叉销售是指向现有的客户提供新的产品和服务的营销过程,那些购买了某种产品和服务的客户很有可能同时购买你能提供的某些他感兴趣的相关产品和服务。另外一种形式就是"升级销售",即向客户提供与他们已购买的服务相关的增值服务。例如,电信公司向已经使用标准长途电话服务的客户推销优质长途电话服务。它是建立在双赢原则上的,对客户来讲,要得到更多更好满足需求的服务且从中受益,对企业来讲,也会因销售额的增长而获益。
(8)欺诈行为分析
通过数据挖掘算法,分析各种骗费、欠费用户的性质和消费行为,建立一套欺诈欠费行为的规则库。当客户的话费行为与规则库中规则吻合时,系统可以提示运营商相关部门采取措施,预测可能的欺诈用户,从而降低运营商的损失风险。一般流程是根据挖掘算法,如聚类算法、分类算法、关联规则和线性回归等生成挖掘模型,然后应用挖掘模型对相关数据进行挖掘,最终得到需要的挖掘结果,也就是电信欺诈侦测模型。
(9)市场分析
数据挖掘在市场分析中的应用包括市场推广分析、市场特点分析和业务趋势预测等。通过回归分析算法可以预测发展趋势最快的业务,从而决定业务重点和发展趋势。客户市场推广分析(如优惠策略预测仿真)是利用数据挖掘技术实现优惠策略的仿真,根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优惠策略中存在的问题,并进行相应的调整优化,以达到优惠促销活动的收益最大化。
(10)网络告警分析
在电信网中每天都会产生大量的告警数据,在这些数据中隐藏着很多有价值的信息。这些信息可以用来过滤冗余的告警,在网络中进行故障定位和预测严重的错误。但这些信息是隐藏在数据中的,通过数据挖掘才能获得。在告警数据中可挖掘出不同类型的知识,例如神经网络、危险模式和规则发现等。
责任编辑:王利强