大数据背景下基于统计学习的5G套餐潜在用户识别

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:flangxisi888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第五代移动通信技术(简称5G)的快速发展,5G在中国已经正式投入商用,5G终端用户正在以迅猛的速度增长.目前,电信运营商在5G领域的竞争进入了白热化阶段,推出的电信套餐种类愈发丰富多样.电信套餐种类的多样化导致传统的粗放式营销策略的弊端日益暴露,而用户对套餐的需求也愈加精细化.此外,随着数据收集和存储能力的提升,电信运营商拥有大规模的用户信息数据.在此背景下,基于重庆地区2020年某三个月的移动用户信息数据,本文研究了5G潜在用户的识别问题和电信套餐的个性化推荐,具体内容为:1、研究了5G潜在用户的识别模型.首先,对经过预处理之后的数据进行基于惩罚的变量选择,得到对5G潜在用户识别有重要影响的变量;其次,对筛选出的变量与是否为5G用户进行相关性分析;最后,建立了基于逻辑回归和随机森林算法的5G潜在用户识别模型,并进行了详细的评价.经过分析,本文得到如下结论:(1)随机森林在识别效果上有优势,精确率、召回率和F1-score和AUC值都比逻辑回归高;(2)从总体来看,参数调优后的随机森林模型准确率为77.39%,具有最好的识别效果.2、研究了电信套餐的个性化推荐问题.首先,基于5G套餐的业务类型和用户的基础信息数据、行为信息数据等进行逻辑回归建模,并通过wald检验来检验各指标的显著性;其次,基于K-means聚类,提出了基于聚类优化的协同过滤推荐算法.本文的分析结果表明:基于聚类优化的协同过滤推荐算法的精确率为70.63%,比传统的协同过滤推荐算法的精确率提升了 14.92个百分点.另外,基于聚类优化的协同过滤推荐算法还大幅节省了计算时间.新的个性化推荐算法为运营商推广电信套餐提供了新方法.
其他文献
主题班会是国家实施素质教育和核心素养教育的重要途径,是学校落实现德树人根本任务的有效形式,是班主任做好班级管理工作的重要法宝,更是学校培养学生良好的思想道德素质、日常行为习惯和自我教育能力的主要阵地。主题鲜明、形式丰富多样、内容贴近学生实际、环节完整的主题班会,不仅能有效发挥育人功能,而且能形成主题班会的吸引力,增强学生的参与意识和参与积极性。然而,主题班会的实际开展效果并不理想,尤其是在广阔的农
学位
伯恩斯坦的教学话语观产生于“新”教育社会学崛起的大背景之下,植根于涂尔干的结构主义之中,对索绪尔、韩礼德等人的语言学思想精华进行了吸收与继承,是其本人符码理论的进一步发展与具体运用。伯恩斯坦的教学话语观关注教学话语的建构与传递过程,即关注课程知识的选择、分配、组织、传递与习得过程。借助话语研究,伯恩斯坦对教育在文化再生产中的实践方式进行了剖析,揭露了教学实践中蕴含的权力与控制原则。研究与探讨伯恩斯
学位
<正> 巴陵石化公司研究院研制的高纯度、低粘度双酚A型环氧树脂(E—56)于去年底通过了部级鉴定。该树脂具有氯及羟基含量低,粘度低,二缩水甘油醚含量高(≥91%)的特性。每百克树脂中含有环氧值0.55~0.57.有机氯≤0.003、无机氯≤0.0003当量,挥发份≤0.5重量%,粘度4~6Pa·s(25℃)·
期刊
现阶段,我国已完成消除绝对贫困的艰巨任务,解决了区域性整体贫困,但这并非意味着贫困问题的终结,我国农村扶贫开发至此踏上了新征程。党的十九届四中全会首次提出“巩固脱贫攻坚成果,建立解决相对贫困的长效机制”,《国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》也对下一步解决相对贫困问题、实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接做出了全面部署和安排。由此可见,我国农村扶贫开发重心已从消除绝
学位
随着信息技术的飞速发展,超高维数据在各个领域都得到了井喷式增长,如基因科学,金融学,以及信号处理等方面.在现代统计科学中,此类数据伴随的“维数灾难”问题为建模和分析带来了巨大的考验.在协变量的维数p远大于样本n的情况下,往往只有少数几个变量对响应变量有显著影响,因此统计学家需要在进行变量选择之前,剔除冗余变量,识别出最有影响力的解释变量,从而实现降维的目的.特征筛选方法应运而生,成为统计推断中的重
学位
2021年2月25日,习近平总书记宣告:我国脱贫攻坚战取得了全面胜利!自此,我国进入了巩固拓展脱贫攻坚成果同乡村振兴有效衔接的新时期。但贫困是一个动态变化的过程,脱贫攻坚目标的完成并不意味着扶贫工作一劳永逸,脱贫农民仍存在较大的返贫风险,继续教育由此被赋予了阻断脱贫农民返贫的重要使命。但当前有关继续教育阻断脱贫农民返贫的理论研究和实践探索均需进一步加强。基于此,考察实践中继续教育阻断脱贫农民返贫的
学位
在数据建模过程中,变量选择是一个十分关键的环节,对于数据处理有着非常重要的作用.有效的变量选择方法往往可以把多余的变量去除掉,从而得到包含最优的预测变量的简洁模型.近二十年来,基于惩罚思想的变量选择方法受到广泛关注,成为了许多统计学家们研究的热点问题.惩罚方法不仅可以实现变量选择,同时还可以得到参数的估计,从而减小计算量.因此,在涉及数据处理时,惩罚变量选择方法有着很大的优势.已有的SCAD和MC
学位
随着国际间的交流越来越频繁,英语作为一种交际语言的重要性也愈发明显。然而,我国学生使用英语交流的能力和水平却不尽如人意。究其原因,是英语教学方式仍存在一定的问题,比如缺乏学习英语的语言环境,更多的还是用汉语来教授学生英语,结果事倍功半。沉浸式教学作为一种第二语言教学模式,植根于语言本身的特点,将英语学习和环境有机结合,可以更高效、更快速地提高学生的英语应用能力,这可以帮助解决我国英语教学方面正面临
学位
正态分布作为统计学最重要的分布之一,具有重要的理论价值和应用价值,其显著特征是密度函数的对称性.这也使得正态分布的研究在数学上变得容易处理,然而在物理学、生物医学、金融保险等领域,真实数据往往呈现重尾,偏态的特征,因此探索一类偏态分布无论在理论上还是实践中都具有重要意义.本文总结了常见的构造偏态分布的方法和研究结果,在此基础上,提出了一类新的混合多元正态分布,其本质上推广了均值混合的多元正态分布.
学位
由于在工农业中的广泛适用性,最小低阶混杂(minimum aberration,简称MA)准则下的最优部分因子(fractional factorial,简称FF)设计的研究在过去的几十年里受到了广泛的关注.当运行FF试验时,试验的运行顺序通常需要完全随机化.然而,在试验中改变某些因子的水平有时是比较困难或花费比较高昂的.部分因子裂区(fractional factorial split-plot
学位