【摘 要】
:
现如今,电信行业市场高度饱和,各个运营商之间的竞争伴随着携号转网的大规模实施不断加剧,5G业务的兴起又让竞争激烈的运营商有了新的转机。如何抓住5G兴起这一机遇,根据现有5G用户信息及时识别用户对5G的需求,有针对性地提供相关服务,是运营商需要特别关注的问题。在此背景下,本文以数据挖掘技术为主线,对现有5G用户的相关信息进行分析和处理,从类不平衡问题的角度出发,建立潜在用户预测模型。本文的主要研究工
论文部分内容阅读
现如今,电信行业市场高度饱和,各个运营商之间的竞争伴随着携号转网的大规模实施不断加剧,5G业务的兴起又让竞争激烈的运营商有了新的转机。如何抓住5G兴起这一机遇,根据现有5G用户信息及时识别用户对5G的需求,有针对性地提供相关服务,是运营商需要特别关注的问题。在此背景下,本文以数据挖掘技术为主线,对现有5G用户的相关信息进行分析和处理,从类不平衡问题的角度出发,建立潜在用户预测模型。本文的主要研究工作如下:(1)基于业务的理解,对从某运营商合作企业获取的5G用户数据进行相关描述并对数据的特征维度进行多层划分,对数据进行包含数据清洗、去除唯一属性、数据变换、数据抽取等在内的一系列预处理操作,并针对预处理后的数据进行特征构建和多元的特征选择,丰富数据属性的同时又筛选出应用于模型训练的同目标变量高相关性且彼此间低冗余的数据特征。(2)基于5G潜在用户的预测问题建立分类预测模型,具体包括逻辑回归和决策树模型、基于Bagging策略的随机森林模型、基于Boosting策略的XGBoost和Light GBM模型,并将各个模型在准确率、召回率、F1值、AUC值等四个评估指标上的表现进行对比分析,证明了后三者所属的集成学习模型的5G潜在用户预测效果总体上要优于前两者所属的单一机器学习模型。(3)为了弥补集成学习模型数据均衡化处理缺失的问题,本文提出将SMOTE过采样方法辅以ENN降噪的SE(SMOTE_ENN)方法融合到集成学习模型上的SE_RF、SE_XGBoost、SE_Light GBM模型,并与单一的SMOTE过采样方法及ENN欠采样方法对用户数据不均衡问题的影响进行对比分析。结果表明,SE方法较二者对于模型的预测性能提升更为明显。(4)为了提高各集成学习模型的分类能力和泛化性能,本文将上述的SE_RF、SE_XGBoost、SE_Light GBM三种算法进行基于Voting的自定义权重软投票策略的异质模型集成。通过对比,不难发现该方法同基于少数服从多数准则的硬投票策略、基于权重值的默认参数软投票策略对5G用户而言具备更佳的预测性能。
其他文献
光学微腔是一种构造简单,应用广泛的基础光学元件。对于光学器件来说,极小的尺寸和高集成度是十分重要的,光学微腔的尺寸一般在几微米到几百微米之间,可以满足这一要求。同时光学微腔具有较好的品质因数和极低的模式体积,这些突出的优势使得光学微腔发展迅速,不仅局限于传统光学,在量子信息和集成量子芯片方面更是拥有广阔的应用前景。下面选取新型二维材料黑磷创建了四种光子晶体微腔结构,并在表面等离子体理论的基础上对这
本文利用面板数据模型,为中国城镇化率的决定因素分析和未来趋势预测提供了一套新的方法。该方法在国际比较的视角下,基于跨国数据,首次区分了中国城镇化过程中的经济动力和改革动力,进而为中国新发展阶段城镇化率趋势预测中同时考察经济因素和改革因素的作用奠定了基础。利用本文提出的分析工具,实证分析表明:典型经济因素和体制改革因素都是中国城镇化率提升的重要动力,改革因素的贡献更为突出。本文预测2021—2035
现如今国内的经济水平不断提高,社会转型速度提升,社会各阶层矛盾日益突出,学校作为社会中一部分,很容易受到突发事件的影响。学校属于社会的一个构成部分,中小学校园突发事件应急管理的问题备受关注,维护好学校的稳定环境、消除隐患因素,乃是不可忽略的工作。论文对抚宁区中小学校的突发事件应急管理工作进行了探讨,符合时代的发展需求。文章梳理了应急管理相关的理论基础,对中小学突发事件应急管理的重要性进行了分析和阐
水声信道估计是水声通信中非常重要的一环,对提高接收端对信号的解调性能至关重要。水声信道是一个复杂多变的稀疏信道,将正交频分复用(OFDM)系统和压缩感知理论应用于水声信道估计中可使水声信号高速有效的恢复。现有的水声OFDM信道估计算法大多是在静态水声环境下逐符号进行的,这忽略了水声信道的动态特性,使算法复杂度高、实时性差。本文在原有的水声信道估计算法的基础上利用水声信道时变性的特点对现有算法进行了
新冠疫情仍然是汽车市场增长面临的最大不确定性因素。疫情的延续及动态清零的防疫政策将继续对宏观经济和居民消费的全面恢复形成一定抑制,供应链的瓶颈也将延续。不过,宽松货币的政策预期、针对中小企业的减税补贴计划都有望对冲疫情给经济和居民消费信心带去的潜在负面影响。此外,原材料、芯片等核心零部件的供应约束也将随着下半年新增产能的释放得到有效缓解。
尽管人员在应激事件下产生一定的应激压力对身体有益,但长期累积必然会产生诸多健康问题,严重时可威胁其生命安全。因此对应激事件下人员应激状态的精准识别与生理反馈训练变得尤为重要。本文主要基于科学的数据分析方法实现关键生理信号特征的提取与优选,并结合智能学习算法构建人体应激评估模型。并进一步探索了可被干预的人体内源调控与生理信号分析结合的闭环训练架构,引入了带反馈调节的人体内源生理调控训练模式,通过分析
项目记忆是个体对事件中单个项目的记忆,而联结记忆则是对特定事件的项目与项目之间、项目与背景信息之间的关系记忆,面孔识别联结记忆是将面孔-姓名匹配信息进行捆绑记忆,失认症、老年痴呆等患者存在与面孔识别相关的联结记忆障碍,探讨面孔识别联结记忆的神经机制具有重要意义。目前对面孔识别脑功能的研究主要集中于心理学认知行为、孤立脑区活动状态,而对面孔识别高级认知功能状态的脑网络研究较少,因此为了揭示面孔-姓名
2021年,中国汽车产业有喜有悲,既经历了高速增长,也经历了大幅度下降。好在四季度汽车产业运行较三季度有所回升,未来汽车产业运行趋势向好。
近年来学生课业负担过重的问题越来越突出,国家针对这种情况也采取了必要的手段和措施。为了深入贯彻和落实《中共中央办公厅国务院办公厅关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,教师应该进一步优化语文作业设计,减负提质,培养学生的语文核心素养。
进入21世纪以来,我国老龄化程度增速加快,养老资源的配置问题愈发引起关注。1999年伊始,河北省初次步入人口老龄化社会,养老问题日益严峻。本文基于空间分析的相关方法,对河北省各城市老龄化水平的空间分布现状和空间关联关系进行分析,结合养老资源配置评价模型,对河北省老龄化程度与养老资源配置现象进行了梳理,运用地理集中度和匹配度公式,总结了河北省现阶段老年人口与养老资源空间集聚程度的匹配情况,并根据研究