基于数据挖掘技术的电信用户粘合度评分研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zhangshuai5365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的发展,电信运营商承载着大量的用户数据。同时随着经济的不断发展,电信用户的个性化需求也日益凸显。在通信市场已经达到饱和的状态下,面对用户产生的大量数据和个性化需求,精准营销、及时主动推荐以及实现企业价值和客户价值的共同提升将是电信运营商面临的新挑战。基于新的背景新的挑战,本文利用数据挖掘技术对电信用户进行评分并给出合理的用户提值策略以维持甚至提高用户的粘合度。首先,本文对数据进行了预处理。根据实际业务情况对原始数据的缺失值进行了填充,并对处理完的数据作相关性矩阵图和多重共线性检验,发现变量之间未存在明显的相关性和多重共线性。其次,本文对预处理后的数据采用基于并行寻优的特征选择方法进行特征选择。其中,基于统计的特征选择方法选择的是IV信息值法,基于学习模型的特征选择方法选择的是随机森林特征选择和XGBoost特征选择;将随机森林和XGBoost选择的特征得分按权重计算总评分并与IV信息值法相结合,选择两种方法剔除的变量交集进行剔除,最终剔除了6个变量,用于构建模型的变量为9个。最后,本文对处理之后的数据进行了分类模型的构建和评分卡模型的构建。本文先后采用随机森林、朴素贝叶斯、逻辑回归、Light GBM、Blending融合、Stacking融合和GBDT+LR融合模型对数据构建分类模型并对各模型的评估结果进行对比,得到GBDT+LR融合模型的效果最好,F1值为0.7434,AUC值为0.9182,最终选择GBDT+LR融合模型进行用户的正负样本分类预测。本文选择传统的基于逻辑回归的评分卡模型,通过变量分箱、WOE值计算、WOE值转换等步骤输出用户得分,并根据用户得分划分用户等级,根据用户等级和用户提值推荐给出用户粘合度提高策略。通过模型评价和模型验证,评分卡模型的AUC值为0.85,KS值为0.597,验证数据的AUC值为0.87,KS值为0.594,且用户得分分布基本符合正态分布,模型的泛化能力较好,具有较强的稳健性。
其他文献
状态观测器可以借助可测信息对不可测的系统状态进行估计或重构,故基于观测器的控制方法在现代控制理论中至关重要.随着脉冲系统理论的发展,一种只需离散时刻的输出信息即可完成状态观测的脉冲观测器被设计与研究,其相关的镇定,同步控制等问题获得诸多关注,而能否将其应用到脉冲控制理论中还有待深入研究.另一方面,对于具有不可测状态的延迟系统,当系统受到不可测延迟以及未知外部干扰影响时,如何构造观测器以及设计相关控
学位
1944年,《博弈论与经济行为》一书的出版标志着系统的博弈理论产生.博弈论主要关注理性个体在特定的环境下如何进行决策.针对有限博弈,其中一个重要的研究方向是探究其在策略形式下的拓扑结构,这对揭示有限博弈的本质特征和分析其相应演化博弈的动力学具有显著作用.本文基于矩阵半张量积方法,构建了有限纯调和博弈和有限多势博弈的向量空间基底,基于此,进一步探究了有限纯调和博弈的纯策略纳什均衡和有限多势博弈的纯策
学位
在过去的几十年中,许多研究人员将重点放在动力学系统的Lyapunov渐近或指数稳定性上.渐近或指数稳定性的典型特征之一是,随着时间趋于无穷大,解将趋于平衡状态.因此,难以实现快速的瞬态和高精度的性能.有限时间稳定性作为渐近稳定性的特例,意味着系统在有限时间内达到平衡状态,这为解决许多工程问题提供了一种有效的工具.经典的有限时间稳定性定理在许多领域得到了广泛的应用,如复杂网络的有限时间同步,航天器的
学位
数学学习障碍是当前国内外数学教育界所亟待解决的重大难题之一。在数学学习过程中出现的学习障碍如果不能及时的调整,将会影响学生下一阶段的学习,甚至影响其一生。在数学课堂教学环境中,学生个体的学习状态和能力对于学习效果有直接影响。教学行为干预模式(Responsiveness-to-Intervention,RTI),最早兴起于美国。研究者们发现该模式能够有效克服识别数学学习障碍的传统模式容易误诊、干预
学位
本论文主要研究距离控制数和距离控制圈的相关问题.设G=(V(G),E(G))为一个简单图.如果对于任意不属于顶点子集S的顶点v,都在S内存在一个顶点u满足dG(u,v)≤2,则我们称S∈V(G)为G的2-距离控制集.G的2-距离控制数2(G)是指G中最小的2-距离控制集的大小.设m是一个非负整数,给定图G上的顶点v和圈C,若G中任意的顶点v到圈C的距离都小于等于m,我们称圈C是图G的一个m-距离控
学位
本文发展了双参数奇异摄动问题在Bakhvalov-type网格上的有限元方法.双参数奇异摄动问题是奇异摄动问题的一个分支,它们出现在物理学和力学的许多领域中,其中包括液晶材料和化学反应的数学模型,电子网络,控制理论等.因此近年来关于此类问题的研究引发了广泛关注.众所周知,由于小摄动参数的存在,奇异摄动问题的解中通常会存在变化剧烈的层,此时经典的数值方法无法给出高质量的数值解.因此人们开发了不同的数
学位
在核心素养的要求下,学生不仅要掌握基本的知识技能,还要体会其中所蕴含的思想方法,发挥学习的主动性,对知识充满好奇心、求知欲。因此教师应该发挥他们的主导作用,引领学生学会主动学习。函数的基本性质是高中数学学科中比较重要的一部分内容,所包含的知识点不仅多而且十分的复杂和抽象。学生接受起来不容易,因此需要寻求更好的教学方式进行教学。而样例教学对学生来说是一种有效的教学方法,并且它也是发挥学生主动性的一种
学位
当前,注重数学语言的表达是世界各国课程发展的趋势,加强数学语言的表达和交流也是我国课程标准的要求,数学语言的表达、交流水平同样也决定着核心素养的落地水平。但在研究分析中发现,当前对于数学语言的研究关注热点,主要在数学语言的重要性以及如何提升学生的数学语言表达能力方面,对于高中生数学语言表达障碍的研究较少且不够深入,这也说明,对于数学语言表达障碍并未形成深刻认识。因此,全面分析高中生在数学语言表达方
学位
《普通高中数学课程标准(2017版)》指出,数学学习要以学生为主体、以学生发展为本,创设合适的情境引发学生思考,引导学生把握数学学习的本质。由此可见,数学学习愈加重视对本质的认识。因此,概念教学受到越来越多的重视。并且可以发现,新课标的理念与弗赖登塔尔的再创造思想相吻合。基于此,本文以再创造为理论基础,选取高中的核心内容——函数作为研究对象,进行概念教学的相关现状研究。本文通过对现有文献的研究,梳
学位
在当今社会,个人信贷业务快速发展,信贷机构从贷款中获利的同时,也承担着相应借款人违约的风险.如果借款人发生违约行为,信贷机构会遭受严重的财产损失,因此,信贷机构希望通过贷款申请人提供的征信信息来识别违约风险.与此同时,数据挖掘方法在金融风控领域得到广泛应用,使用数据挖掘方法来预测个人贷款违约行为就成为了重要的研究方向.本文以国外信贷平台Lending Club用户的2017年信贷记录为例,建立个人
学位