基于循环神经网络的电信客户流失预测研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:lxkef
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电信行业在每个国家都扮演着重要的作用,同时也存在着激烈的竞争。自从进入21世纪之后,我国的电信行业就飞速地扩张,在移动电话、固定电话、网络线路等多个业务领域深入到人们的生活中。随着近几年市场的饱和,电信客户流失问题越来越受到电信运营商的关注。实际上,电信客户流失始终是电信行业重点关注的领域,其中因为移动电话本身具有的流动属性,移动电话客户的流失最为严重也最受关注。在我们国家,电信客户流失之所以持续受到关注,可以概括在两个方面:一方面,随着中国移动电话市场真正达到饱和阶段,国家政策指导完善携号转网策略,极大地提升了移动电话客户更换电信服务商的便利性,诱发了更高的流失率;另一方面,电信运营商对数据的采集维度增加,采集频率越来越高,传统的建模预测方法可能无法充分挖掘数据的信息,需要提出适应于当前数据量和数据维度的建模方法。目前学术界对客户流失预测的方法主要集中在几个方向:针对数据不平衡问题提出特定的采样策略再配合传统分类器;使用经典的生存分析方法,从生存数据的角度对客户流失进行建模,分析不同因素对客户生存时间的影响;使用多种典型的分类器进行融合,使用加权的方法提高预测精度;使用深度学习模型,利用多隐藏层尽可能提取有用特征进行建模。但是,这些方法有一些缺点:(1)无法应对当前数据颗粒度的细化,以及因此而出现的具有时间序列特性的动态数据;(2)需要进行复杂的人工工程,过程不够智能化。本文从生存分析模型的构建为切入点,提出了一个端到端的时变深度生存(TVDLS,Time-Varying Deep Learning based Survival)模型。首先,使用标准循环神经网络(RNN)对动态数据进行编码,替代繁琐的特征工程的同时能够自动地、更加充分地抽取动态数据的信息;接着使用门限循环单元网络(GRU)构建时变深度生存模型,在生存分析模型中对损失函数进行了修改以适应客户流失数据的生存属性,具体来说相比于经典的损失函数增加了对非删失数据在事件发生时间点之前存活概率的拟合,能够具有更好的学习效果。本文模型在两个层面与之前的方法进行比较:(1)与经典的生存分析模型、深度生存分析模型比较生存函数的拟合能力,使用C-index和ANLP两个指标进行比较,均得到更好的效果;(2)与特征工程配合机器学习的方法进行流失预测精度的比较,使用AUC和MP两个指标进行比较,在AUC指标上能够得到更优的效果。最后,本文进行子集分析,考虑几种不同的客户数据时序变动情况,分析本模型是否能够充分学习到这种变动情况,实验表明本文模型的表现更优,这能够帮助业务人员对具体的群体进行更准确地预测的。
其他文献
21世纪社会进入了数据时代,人类收集、储存、传输、处理数据的能力取得了飞速提升,人类社会积累了大量数据,亟需能有效地对数据进行分析利用的计算机算法,机器学习顺应了数据时代的这个迫切需求,机器学习领域因此取得了巨大的发展、受到了广泛的关注。在计算机科学的分支科学领域中,无论是图形学、多媒体,还是网络通信、软件通信,乃至体系结构、芯片设计,机器学习已成为最重要的技术进步源泉之一。数据分类作为一种基础的
学位
文章立足于人文地理学视野,将山东地区的地理背景、历史风貌进行解读,并分析这些因素对山东梆子发展产生的作用,再深刻剖析旋律、板式结构、人文思想等对其审美特征和风格的影响。除引言与结论外共三章。第一章首先对孕育山东梆子的优越自然环境进行概述,将黄河与运河对山东梆子扎根和传播产生的作用进行分析;其次,以滋养山东梆子的文化环境为切入点,深中肯綮地分析山东梆子的丰厚内涵;最后站在人民生活的角度,探析社会环境
学位
多声音乐思维能力是一种综合的思维能力,能增强学生对音乐基本要素的把握,以及对音乐横向、纵向感知力及音乐语言情感色彩的理解。多声部音乐各声部跌宕起伏、结构层次多样丰富,这需要音乐学习者必须培养并拥有对音乐立体空间感知能力,即良好的多声音乐思维能力。多声音乐思维能力培养的根本目的是为了更好地领会音乐作品的内容、风格特点以及艺术价值,其训练内容必然涉及音乐的各个组成要素以及其他的方方面面,因此,培养音乐
学位
表现出周期性并易受外界因素影响的时间序列广泛存在于金融、经济、社会科学、天文等各个领域中。外界因素对序列的影响并非一成不变的,这就需要我们选择合理的方法来实时估计外界因素的影响。同时,部分时间序列的周期是未知的,这就需要我们先给出一个较为准确的周期估计,再进一步估计周期序列以及外生性因素的影响,进而对时间序列进行预测与检验。然而目前存在的模型对上述问题没有一个很好的解决方案,故本文针对这种情况进行
学位
《传奇》(En Saga)创作于1893年,是西贝柳斯创作的第一首音诗,西贝柳斯认为《传奇》是令他印象最为深刻的作品之一。虽然西贝柳斯将En Saga作为该作品的标题,却从未对其标题的确切含义进行解释,现有文献中关于《传奇》标题含义的诠释内容大致包括民族史诗、小说、画作以及作曲家的自身经历等,经过对相关文献的系统梳理,本文认为源于民族史诗《卡莱瓦拉》的诠释更加符合西贝柳斯当时创作的历史时期特点。《
学位
随着互联网的高速发展,互联网广告在我们日常生活中扮演着越来越重要的角色,如何提高广告点击率(Click-Through Rate,CTR)预估的准确性是学界和工业界研究的热门领域之一,因为提高广告点击率预估的准确性不仅有利于提高广告主和出版商的收入,还可以提高用户体验。因此,研究如何提高点击率预估的准确性是有意义的。本文以提高广告点击率预估的准确性为目标,在分析了业界三种经典模型——逻辑回归(Lo
学位
传统的金融理论在理性人的假设前提下,认为宏观经济指标通过影响未来的预期现金流和贴现因子来影响股票收益,宏观经济被认为是影响股票收益的理性因素。真实的股票市场却经常与宏观经济基本面发生背离,传统的金融理论无法对真实的股票市场进行解释。而行为金融学将人类心理纳入传统金融的框架下,使得理论和实际的沟壑有了弥合的可能。行为金融学认为人们在实际投资决策过程中并不是理性的,在股票市场与宏观经济产生背离的时候,
学位
贾达群教授作为中国当代前卫作曲家,在《狂想曲·梨园腔魂》中以我国西北地区传统音乐元素为素材,将传统作曲技法与现代作曲技法相结合,创作出了具有象征性的民族音调。主题音调在发展过程中具有一定的弥漫性,主题性旋律的生成对曲式结构的划分起着决定性作用。在横向多声部线条思维与多重织体复合的思维下,该作品织体形态丰富,音响整体化特征尤为突出。在五声性调式思维的统领下,作曲家对五声纵合性和弦结构进行了由五声至七
学位
民族文化在交流与共享中进步。近年来,在文化“引进来”和“走出去”战略相结合的背景下,为进一步加强中西方文化交流,越来越多的国内出版商引进外文书籍,其中历史类文本逐渐吸引了读者的注意,其翻译也随之成为国内翻译领域的一个热点。《萨拉米斯战役》(The Battle of Salamis)是由康奈尔大学古典学系和历史学系教授巴里·施特劳斯(Barry Strauss)所撰写,主要介绍公元前480年,希腊
学位
本硕士学位论文主要研究异质性空间面板滞后模型下中国各地级市雾霾污染年增量的异质性空间效应。基于1999年到2016年中国市域的PM2.5浓度的一阶差分数据和各地级市的四个影响因素(人口密度、人均GDP、第二产业占比、道路铺装率)的1999年至2016年三年滑动平均数据,考虑到各个城市对其他城市的影响力不同这个事实,提出了异质性空间面板模型的理论说明。在实例分析中,经过莫兰指数检验、LM检验等方式,
学位