5G套餐潜在客户预测及基于双层LightGBM的改进

来源 :山东大学 | 被引量 : 0次 | 上传用户:yxws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前5G商用业务逐步兴起,面对国内5G市场蕴含的巨大潜力,各大运营商开始在全国范围内争抢市场份额,推动潜在的5G用户进行转化。在当前大数据背景下,如何利用掌握的5G用户信息,挖掘数据潜在规律,进行针对性营销,从而提高营销效率并降低运营成本,这是运营商需要关注的问题。在此背景下,本文基于某运营商的4G转5G用户的数据信息,通过建立多种机器学习模型,对潜在5G套餐客户进行预测。本文的主要研究工作如下:1.基于业务层面对数据进行分析与预处理。对预测变量进行描述性统计和可视化分析,得到数据集的特征数据分布情况。在此基础上进行数据预处理工作,包括数据清洗、特征编码、特征构建和特征筛选,为模型训练提供有效的输入变量。2.建立5G套餐潜在客户预测模型。首先搭建Logistic回归模型和朴素贝叶斯分类器这两种单一机器学习模型,对5G套餐潜在客户进行预测,之后建立了随机森林、GBDT模型和LightGBM模型三种集成学习模型进行预测。对5个模型在F1score、AUC值、精确率和召回率四个评估指标上的表现进行评估和对比。发现集成学习模型在5G套餐潜在客户预测中效果要优于单一机器学习模型,其中LightGBM模型的综合预测效果最好。3.为提高预测准确性,本文进行了进一步的模型优化。基于上述模型的实证结果,考虑到LightGBM模型的综合预测效果最好,而随机森林的精确率最高,因此结合随机森林的思想,提出改进的双层LightGBM模型。将第一层LightGBM模型输出的叶子结点的结果作为新的样本特征,并将得到的新数据集输入第二层LightGBM模型进行预测;对于第二层预测模型,基于随机森林的思想,搭建多个LightGBM模型,在训练前进行随机样本选择和特征选择,通过投票法获得最终结果。实证结果显示,改进的双层LightGBM模型在Flscore和AUC值上相比传统的LightGBM模型均有提高。这说明本文提出的改进模型有效地提高了模型预测性能,提升了模型的泛化能力,从而能够更有效地应用于5G套餐潜在客户预测中。
其他文献
股票市场上,任何理性的交易行为都是由信息驱动,而不同的投资者接触到的信息不一致,因而其交易方式也不同。我们根据Level-2数据(Level-2数据指的是上海证券交易所上市交易的证券产品的实时交易数据)得到的股票资金流向数据经过分析后可以挖掘出市场微观结构的交易信息,反映出股票涨跌背后交易力量的强弱,并能够预测出股票未来的涨跌。将股票的资金流向因子运用到行业上,观察行业资金流向因子对于不同行业间的
学位
ESG是一种关注企业环境、社会和治理绩效而非财务绩效的投资理念和企业评价标准。该评级体系将企业应承担的社会价值以各类具体化企业发展指标融入到具体的企业价值中,通过量化公开的方式,促使企业积极关注社会整体价值,承担社会责任,从而促进经济社会的健康可持续发展。Jianan Liu等(2019)[13]提出了中国版三因子模型(CH-3),该模型通过对Fama-French三因子模型进行改进使其更为适应中
学位
随着计算机信息技术的急速发展,大数据的应用也越来越广泛,对应至金融行业,高频交易也逐渐成为交易策略的主流,交易产生的高频交易数据也成为金融数理和计量经济的研究热点。对比传统的低频金融交易数据,高频交易数据通常可以储存除了交易价格以外的其他维度的市场信息,但是由于交易市场规则的不完善,会导致高频金融数据的现实观测值和理论均衡值间出现偏离,这些偏离通常称为微观结构噪音,因而之前基于传统低频数据构建的模
学位
公司股票产生下行风险的现象在股票市场中时常发生,而我国股票市场存在稳定性差,机构投资者占比较少的现状,所以发生下行风险的现象更加地频繁。因此对于我国市场股票下行风险的研究近年来也成为了被关注的重点。本文利用2014年至2020年期间在我国沪深300成分股股票样本来研究这种显著性影响,以股票超额收益水平和公司下行风险作为因变量对ESG得分变化数据进行研究,探讨二者分别与ESG得分变化之间是否存在显著
学位
生命活动的进行需要蛋白质,基因多样性的表达也离不开蛋白质,作为一切生命活动基础的蛋白质起着异乎寻常的作用。在生物信息学的重要研究方向中,蛋白质结构相似性检索便于学者在更深的层次上研究蛋白质结构与功能之间的关系,尤其当前正处于新冠疫情大爆发时期,对某些病毒蛋白质结构进行检索有助于发现和开发新的疫苗与治疗方法。随着结构复杂性的增加和海量数据的出现,现如今对蛋白质结构检索提出了更高的要求,本文基于3DZ
学位
随着金融市场的发展,金融数据的维度变得非常庞大。高维因子模型在大数据时代引起了广泛的关注,然而传统的因子模型估计方法通常需要假设数据具有有限的四阶矩,这种假设条件忽略了厚尾的影响,和实际中的金融市场数据特点并不相符。因此在将传统的因子模型应用在投资组合时,所构建的投资组合单位风险下的收益可能较低,这与投资者进行投资的初衷相违背。如何应用因子模型,对投资组合作出稳健的估计一直是当前学者们关注的热点话
学位
南阳汉画像石中有大量象人戏兽图像。图像中的熊意象为披着熊皮的方相氏,所戏兽类为以穷奇为代表的十二神兽,图像母题旨在于表现以方相氏和十二神兽为中心的傩舞。图像中的象人形象不仅表现为披着熊皮的方相氏,还包括各类手执道具或兵器的“狂夫”,它们是汉代傩舞的引导者。这类图像多出现于南阳汉画像石墓的墓门位置,它们常与羽人、芝草、仙鹤等形象组合,以此表达打鬼和升仙的思想观念,以祈实现墓主人的生命永恒。
期刊
<正> 吴××,女,27岁。1989年10月13日诊。患者一年前开始,两侧头痛反复发作,午后头痛渐渐加剧,并伴有左侧颜面部麻木等不适。曾在当地人民医院治疗,诊断为神经性
期刊
随着近年来社交网络的流行,推动了基于位置的社会网络(Location-based Social Networks,LBSN)应用的快速发展。加之地理定位技术的成熟,兴趣点(Point-of-Interest,POI)的个性化推荐成为推荐方向热门的研究分支。POI推荐不仅能够在海量的历史签到(check-in)数据中发掘用户的个性化偏好,还能帮助商家根据用户的行为习惯提供更好的服务给用户。POI推荐
学位
<正> 应用“蜈蚣全蝎散”治疗血管神经性头痛102例。治疗前脑血流图有明显改变者71人,轻度改变者23人,正常者8人;其中,男47人,女55人;年龄在28~67岁之间,中老年居多;病程最长28年,最短1年以上。处方:蜈蚣
期刊