基于不均衡数据集与客户细分的电信用户流失预测

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xwg1217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和深化,市场日益饱和,企业很难再延续以往通过吸引新客户来扩大市场份额的经验。一方面是在逐渐饱和的市场,企业发展和吸纳新客户成本较大;另一方面,企业也需要寻找新的发展模式,完成从用户量增长到服务质量提高的转变。因此,维护存量客户防止流失已然成为企业重点关注的核心。论文面向电信客户流失预测场景,先提出基于LASSO和构造性覆盖算法(Constructive Covering Algorithm,CCA)的不均衡数据预测方法L-CCASmote,再进一步结合客户细分对电信客户做流失预测,并分别在公开的数据集与脱敏电信数据集上进行实验验证。论文的主要工作如下:1.针对客户数据严重不均衡、特征空间信息杂乱、特征间存在共线性等问题,提出基于LASSO回归和CCA的不均衡数据预测方法L-CCASmote。该方法先通过LASSO回归提取流失用户特征以优化模型输入,再建立CCA神经网络构造符合样本整体分布的覆盖,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略进行混合采样以平衡数据。LASSO特征选择方法通过与添加L1惩罚项的特征选择、添加L2惩罚项的特征选择以及不做特征选择三种方法进行对比实验,结果表明LASSO特征选择方法在提高模型预测分类能力方面效果更好;L-CCASmote方法通过与SMOTE-Enn、SMOTE-Tomek、Borline-SMOTE、自适应合成采样(Adaptive synthetic sampling,Adasyn)和单边采样(One-Sided Selection,OSS)等五种平衡算法分别在逻辑回归和支持向量机两个分类算法上进行实验验证,结果表明,L-CCASmote平衡数据方法在提高模型流失客户识别率和预测分类能力方面效果更好。2.对于企业来说,客户拥有不同的价值,这些差异反映在样本特征上,也体现在企业客户关系管理决策的资源配置上。为此,进一步提出基于客户细分与L-CCASmote的电信客户流失预测方法。该方法建立了包含10维特征的电信客户价值评价体系,并运用优化的K-means聚类算法、结合主成分分析将客户划分成高、中、低三类价值群体,再运用L-CCASmote方法对每类价值数据集做平衡处理,最后在各价值类平衡后的数据集上和未做客户细分处理的数据集上进行预测实验对比,结果表明基于客户细分的预测方法整体上提高了流失客户识别率。研究工作表明,基于客户细分与L-CCASmote的电信客户流失预测方法,不仅能有效预测出有流失倾向的客户,也能降低不同价值客户群体下的流失规则不同对预测结果的影响,从而提高预测准确率,具有重要的实践意义。
其他文献
目标检测是计算机视觉领域中的一个重要研究方向,其主要目标是在图像中识别并定位目标物体。由于其与许多人类任务的视觉需求高度相关,目标检测技术被广泛运用于工业机器人、视频监控、智能交通等领域。虽然近年来随着深度学习的发展,结合深度学习的目标检测技术也迅速发展并逐渐趋于成熟,但其在真实环境下仍然面临着很大的挑战。在当前的目标检测研究中,目标区域由规则的边界框进行定义,当预测的边界框捕获到足够多关于目标的
学位
随着互联网蓬勃发展,网络中产生的信息越来越多,现在已经进入一个信息爆炸的时代。如何快速有效地获取所需要的信息已经成为当今时代亟待解决的问题。因此世界上越来越多的学者开始将目光聚焦于自动文本摘要技术,希望以此缓解信息过载的现象。近年来,随着深度学习的不断发展,基于深度学习的生成式文本摘要已经占据了主流地位。本文对生成式自动文本摘要技术的研究现状进行了深入地调研,分析现有模型存在的问题,并针对这些问题
学位
随着物联网设备的数量呈指数增长和时延敏感新应用的出现,5G网络中边缘服务器的有效部署变得越来越重要。现有的5G网络边缘服务器部署策略未考虑宏基站和微基站的差异性对于时延和部署成本以及用户移动性的影响。因此,针对宏基站和微基站的差异性对时延和成本的影响,以及边缘用户的移动性对时延敏感服务的影响展开研究是5G网络技术中一个重要的理论支持。通过对现有边缘服务器部署策略未考虑宏基站和微基站的差异性对于时延
学位
期刊
目前,随着无线局域网的快速发展,人们对于构建完整智慧家庭系统的需求也巨幅增加,同时也对和智能家居进行交互的形式提出了更高的需求。由于物联网技术的迅速崛起,Wi-Fi(Wireless Fidelity,Wi-Fi)设备的数量也巨幅增加,也为通过Wi-Fi信号对人体行为感知和识别提供了基础。为了满足人们在体感游戏、人流拥塞检测、家庭安全监测等方面的需求,人体行为识别成为了当前研究者的一个重要研究课题
学位
目标检测任务是计算机视觉领域的基础任务,长期以来传统图像特征方法一直主导着目标检测算法的研究。但随着近年来人工智能理论的快速发展,以卷积神经网络为基础的深度学习方法在多个领域的研究中大放异彩,使之成为当前人工智能最热门的研究方向之一。基于深度学习的目标检测算法在发展过程中出现了两个不同的方向,分别是双阶段方法和单阶段方法。凭借简洁的设计原理,基于单阶段多尺度的目标检测成为近年来研究的主流方向。基于
学位
<正>《普通高中数学课程标准(2017版》中,必修课程包括五个主题,分别是预备知识、函数、几何与代数、概率与统计、数学建模活动与数学探究活动。将数学文化融入课程内容,其中,数学建模活动是重点之一,也是学生掌握数学学科核心素养的关键所在。数学建模是一种具体解决问题的思路与方法,是学生创新思维能力培养的重点。知识经济时代,社会对人才提出了更高的要求,因此高中数学教学也要及时做出改变,将建模教学作为数学
期刊
多智能体协同将会放大智能系统的价值,而一致性问题是多智能体系统协同控制的根本与基础问题。近年来其研究成果被广泛应用于军事、交通、工业、电力等众多领域,并受到各领域研究者的青睐。相较于传统的一致性控制,多智能体系统有限时间一致性控制具有更快的收敛速度及更好的鲁棒性,并能在有限的时间内达到一致,因而具有更好的应用场景并成为研究者们关注的热点问题之一。在现有针对多智能体系统有限时间一致性的研究中,智能体
学位
近年来,多标签学习在图像分类、文本分类、音乐情感分类、视频标注以及基因功能分类等多个领域中得到广泛应用。与传统机器学习不同,由于实例与标签集中多个存在关联,所以多标签学习目的是预测样本的相关标签集合。目前多标签分类的研究主要包括标签特定特征的构造、标签间相关性、类不平衡三个方面;标签特定特征是标签独有的表达,能够代表标签间本质的区别,合理构造标签特定特征能够有效提高对应标签的表达能力;同时由于相关
学位
随着近年来网络的爆炸式发展,每天都有大量图像被上传到社交网络等网络平台上,其中包括大量被篡改的虚假图像。这些虚假图像通常是由各种操作简单化的图像编辑软件制作,由于这类软件的普及和推广,非专业人士也可以轻易的制作大量的虚假图像并传播。这些虚假图像在互联网上的传播将导致很多严重的后果,例如假新闻、谣言等。在数字取证领域和政治军事领域这种现象更加危险和普遍。也正因为如此,大量的研究人员将注意力放在了图像
学位