数据挖掘在电信客户流失预测中的应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:mingN78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电信行业,争取一个新客户的代价往往比留住一个老客户的代价要大得多,因此,客户流失预测是电信运营商最为关心的重点之一。客户流失预测的分析对象是已经流失和没有流失的客户,从他们的行为找出流失客户的特征,然后预测客户未来一段时间的流失概率。这是一个时间序列分类问题。然而,目前对中国电信而言,真正流失的客户占总客户的比例非常小。对于这种不平衡数据的挖掘问题,无论在数据挖掘领域还是在机器学习领域都是一大难题。针对中国电信的需求,本文提出了两种基于时间特征提取(Feature-based)及支持向量机(SVM)的时间序列分类方案。第一种方案称为EM+SVM。主要思想是利用EM(ExpectationMaximization)迭代算法的思想把SVM(SupportVectorMachine)应用于不等长的时间序列分类中。第二种方案称为MSNFE+SVM(Mean-STD-NormFeatureExtraction,MSNFE)。主要思想是利用分层的思想,把不等长的时间序列映射为固定长度的时间特征向量,然后用SVM进行训练、预测。从实验的结果可以看出,这两种方案在处理不平衡时间序列的分类问题时仍然有比较理想的结果。关键字:支持向量机,客户流失,时间序列分类   
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
  两相流体动态边界在许多科学应用中都发挥着重要的作用[1],例如LOX/H2火箭发动机。动态边界决定了原子化过程,比如液体喷射层打破变成小水滴,这个动态过程可以分为两个连续
  数学物理及工程问题,如油气藏的勘探与开发,大型结构工程,天气预报等,无不归结为求解大型偏微分方程,面临着如何有效解决大规模科学计算的困难。众所周知,区域分裂能够降
  本文主要考虑的是:若随机变量ξ,η∈L2(Ω,FT,P;R),且ξ和η同P-分布,那么对泛函εg[·]而言,εg[ξ]=εg[η]是否总成立呢?事实上,当且仅当εg[·]退化为E[·]时,上式总成
  广义大系统的稳定性和镇定问题是广义大系统理论的基本问题。由于广义系统的特殊性,对其稳定性和镇定问题的研究不仅要考虑稳定性,还要考虑正则性。而广义系统的鲁棒稳定性
分形插值替代传统的插值技术,给出了一个更广泛的插值函数集,它为理解现实世界的现象提供了一种很好的确定性方法。用这种方法,我们不仅能构造非整数维的插值函数,而且也能够构造
度量空间中的不动点理论是非线性泛函分析的重要组成部分,一直是人们研究的热门领域.自锥度量空间被提出以来,其空间结构与性质,尤其是锥度量空间中的不动点定理,更成为近年来国
  一些大规模的物理过程往往在空间和时间上具有很强的局部性质,由井、裂缝、障碍、区域边界等引起的局部性质在空间上是固定的,还有一些情况下的局部性质是随着时间而变化
“前置研究”是指:在正式进入课堂学习之前,学生在教师安排的“前置研究”具体任务的提示下,围绕着将要在课堂上学习的内容,自主进行独立的课前研究学习活动。通过对“前置研究”
2001年11月,在北京电视台和北京有线电视台合并后召开的第四次党员代表大会上,台党委提出了把北京电视台建设成为“国内一流,亚洲领先,世界前列”的战略目标和争创“节目一流