【摘 要】
:
改革开放以来,我国电信业务的总量快速提升,电信业务的收入稳步增长,随之产生的海量电信数据也被研究者们充分利用以挖掘其中的潜在的有效信息来帮助企业进行相关决策。在电信行业中,客户流失给企业造成的损失较企业去获取新客户的成本来说要高,因此流失用户的预测对于电信企业的发展决策来说至关重要。随着近年电信行业CRM(Customer Relationship Management,客户关系管理)系统的不断升
论文部分内容阅读
改革开放以来,我国电信业务的总量快速提升,电信业务的收入稳步增长,随之产生的海量电信数据也被研究者们充分利用以挖掘其中的潜在的有效信息来帮助企业进行相关决策。在电信行业中,客户流失给企业造成的损失较企业去获取新客户的成本来说要高,因此流失用户的预测对于电信企业的发展决策来说至关重要。随着近年电信行业CRM(Customer Relationship Management,客户关系管理)系统的不断升级,其获取的用户数据朝着越来越复杂的趋势发展。针对CRM系统中数据的高维、稀疏、多类别、样本不平衡等特点,如何发现特征之间深层次的隐藏关系和将它们进行更高效特征组合是建立客户流失预测模型的关键。为解决上述问题,本文旨在构建一个更高效的基于特征组合的模型来挖掘具有高维、稀疏、多类别、样本不平衡特点的电信数据之间的关系以更好地进行客户流失预测。因此,本文提出了一个基于GBDT(Gradient Boosting Decision Tree,梯度提升树)特征转换的FL-Deep AFM模型来进行更有效的特征组合来进一步提升客户流失的预测效果。本文的主要研究工作有两个部分。第一部分针对高维、稀疏、多类别、样本不平衡的电信数据样本,设计了一个基于GBDT特征转换的Deep FM模型。通过模型中的GBDT特征转换创造出能够缓解样本不平衡问题的特征。除此之外,模型中的Deep FM部分还可以对特征进行深层次的自动组合以获得更好的分类效果。第二部分为了进一步优化基于GBDT特征转换的Deep FM模型以缓解噪音特征和未完全解决的样本不平衡问题的影响,本文在上述模型基础上还提出了一个基于GBDT特征转换的FL-Deep AFM模型,通过引入Focal Loss和Attention机制以进一步解决样本不平衡和无意义特征的问题从而提升模型的预测效果。本文使用到的数据是真实的电信数据。通过实验对上述提出的所有模型和方法进行了有效性验证,同时实验结果也表明本文所提出的基于GBDT特征转换的FL-Deep AFM模型是可用且有效的,相对于传统的客户流失预测模型能够更好地对客户流失进行预测。
其他文献
当原子分子中的束缚电子在高强度的近红外激光辐照下时,它们会以驱动激光频率的整数倍频率向外发射高频辐射,发射的光脉冲可以到达电磁波谱的极紫外和软X射线区域。由于发射的频率很高并且限制在驱动场频率的整数倍,这个过程被称为高次谐波的产生。在给定单色线性极化驱动场的情况下,P.B.Corkum等人提出了该过程公认的半经典模型,又被称为“三步模型”,它将高次谐波的发射分为三个主要过程:电离、加速和复合,并给
飞秒强激光与原子分子的相互作用是当前研究的前沿和热点之一。当激光电场强度可与原子内部库仑场相比拟时,产生了很多新奇的非线性物理过程,里德堡态激发作为新的强场物理过程受到了广泛关注。与之前的粒子探测相比,光谱测量的方法可以分辨量子态以及其产率随时间演化,对强激光场中里德堡态激发的产生机制的理解是一个很好的补充。强激光场中原子分子的辐射特性有助于深入认识飞秒激光等离子体的形成和性质,具有重要的研究意义
卷积神经网络在图像识别领域取得了巨大的成功,但其训练过程通常需要海量的带标注样本。然而,收集大量标注样本的成本十分昂贵,尤其是在稀有物种识别或医疗影像诊断等场景中。因此,小样本图像分类已成为深度学习发展中十分重要的研究课题。为了缓解标注样本不足导致的模型过拟合现象,现有方法大部分利用结构简单的人工卷积神经网络来提取图像特征。然而,这些网络只包含标准卷积操作,参数量多,模型复杂度高,特征表达能力不足
随着居民消费升级和生活品质的提高,服务机器人产业规模快速增长。迎宾机器人作为服务机器人的分支,是未来吸引实体流量的重要入口。现阶段的迎宾机器人存在几个问题:迎宾机器人任务编辑的用户配置流程耗时长;迎宾机器人任务执行仅将用户视为动态障碍物而使带路效果不好,其引导模式难以满足各类场景的需求。针对上述问题,本文设计并实现了一款操作方便、智能化程度高的迎宾机器人任务编辑和执行系统,分为编辑器模块和执行器模
随着光电子成像技术更为深入的发展和应用,超短激光脉冲诱导分子电离过程中所运用的光电子速度成像技术已然成为分析电离机制、物理过程涉及的量子态、分子结构和超快动力学的良好途径。通过对光电子成像图中提取的光电子动能分布以及光电子角分布的研究,可以获得分子轨道、结构和动力学等方面的详细信息。本篇论文主要研究部分为以下两个方面:在第一部分,主要利用波长为800 nm、脉宽为50 fs的单色激光与氨分子相互作
近几十年来,随着超强和超短激光脉冲的发展,激光技术已成为国际技术竞争的主要前沿之一。强场物理也已成为近年来的热门话题。人们利用激光与物质相互作用,进而在原子分子的自然阿秒时间尺度和亚纳米空间尺度研究电子动力学。最近,一些理论研究表明,阿秒脉冲能够有效地诱导原子分子中的超快磁场。这种光诱导的磁场为分子和分子磁学的许多研究提供了可能。本文系统地研究了He+离子、双原子分子H2+和N2、三原子分子H32
分子转子是分子机器中的重要一类,这类分子中某特定片段无能垒转动引起的奇异物理特性使其受到了广泛关注。由于硼原子缺电子特性导致了高度离域成键模式的硼团簇,这为分子转子提供了良好的电子结构。2010年,具有双重芳香性平面B–19团簇中内核(B6)相对于外部硼环的无能垒转动被理论研究中发现,并命名为分子马达。随后,一系列平面纯硼团簇(B+13,B20-/2-,B182-,B-40,B-11,B+15)被
近年来,大型室内场所安全一般使用人力巡逻或安装摄像头。但人力昂贵且人员素质不一,全覆盖安装摄像头价格高,因此成本低且效果好的安防机器人逐渐成为主流选择。安防机器人巡逻决策包括地图处理、巡逻路线规划、巡逻策略选择和巡逻过程监控。目前市场上现有的安防机器人巡逻决策系统大多存在两种问题:一是采取固定巡逻路线,缺乏区域侧重点,且路线难做到全覆盖;二是巡逻策略比较单一,无法满足人们对安全更高的需求。为了解决
在软件需求分析过程中,数据库设计领域的实体关系图能够直观地展示需求描述的实体属性与关系,有利于系统数据库建模和分析。然而,人工设计与绘制实体关系图存在耗时长、效率低的缺点。因此,实现从数据库需求文本生成实体关系图的自动化流程,具有重要的研究意义和应用价值。现有的需求文本生成实体关系图方法存在两个问题:一是缺少合理的分类方法来筛选出与图元素相关的关键内容语句,而无关语句可能会引入误差内容;二是现有研
过敏性疾病是一种常见的多发性疾病,关于其发病率的调查结果显示在33个国家中的13.9亿人中,患病率高达22%,过敏性疾病已经成为了二十一世纪长期困扰大众健康的公共卫生挑战之一。抗组胺药物具有对治疗过敏性疾病的良好适用性,因此它们被广泛用于过敏性疾病的治疗当中。通过对污水处理厂进水中药物的浓度进行检测,从而反算药物消耗量的污水流行病学方法,可以很好地估算某一地区中目标药物的人均消耗水平,而药物在管道