针对匿名电信客户数据的流失预测模型

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:acdef2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流失预测是电信客户关系管理的核心环节,通过数据挖掘技术建模,有效预测风险客户的流失概率,辅助运营商有针对性地设计营销策略,为科学决策提供数据支持。通过大量文献调研,可知电信客户流失预测一般作为二分类问题进行研究。现阶段该研究中面临的关键科学问题如下:第一,数据集中正负样本的非均衡分布抑制了经典数据挖掘算法的分类性能;第二,商用大数据的隐私保护策略提高了研究工作者理解数据真实意义的难度;第三,传统特征工程构建的特征总量存在上限,为模型优化设置了瓶颈。为了克服正负样本非均衡分布的问题,本文融合采样技术与集成学习理论,提出非均衡组合分类器。该模型采用有放回抽样策略构造正负样本近似均衡的数据子集,针对数据子集训练逻辑回归分类器,采用投票机制累积所有分类器的预测结果,以预测结果的平均值作为集成学习模型的最终输出。为了克服匿名特征导致的数据理解问题,本文融合数据离散化技术与独热编码技巧,提出基于深度学习构造高维特征的方法。该方法通过层次化的网络结构,抽取大量冗余特征,弥补加密数据难以利用领域知识和专家经验的缺陷。此外,借鉴决策树模型处理非均衡分类问题的优势,本文将梯度提升树模型应用于电信客户流失预测建模,进而提出基于提升树模型提取低维特征的方法。该方法融合集成学习理论与统计理论,同时实现预测性能的提升与计算复杂度的降低。实验证明,本文提出的相关算法有效提升了模型的预测性能,但是由于数据集样本容量不足,限制了部分算法的性能发挥,因此仍然存在深入研究的空间。
其他文献
<正> 黄河在我脚下。我立于邙山极目阁,在凝望、在沉思——中州,我的故乡,一个令人思接千古而倍感亲切的称谓,数千年的华夏文明正是从我面前这条宽阔而充满急流的母亲河起源
期刊
<正>为进一步严肃党内政治生活,提高"三会一课"质量,察右中旗结合"两学一做"学习教育,鼓励引导基层党组织探索实践情景式、访谈式、微党课等形式灵活、党员干部喜闻乐见的特
期刊
房屋建筑行业是一个涉及面较多、管理复杂的行业,建筑企业为了在房屋建筑市场中保持一定的竞争优势,必须加强房屋建筑工程的管理。对此,本文首先介绍了建筑工程管理中的常见
目的:探讨对应用静脉留置针进行输液的手足口病患儿实施细节护理的临床效果。方法:将近期内在遵义医学院附属医院儿科接受治疗的200例手足口病患儿作为研究对象。将这200例患
针对高校研究生的思想特点和问题,提出了以加强研究生党建工作来促进整个研究生队伍思想政治教育的工作思路。本文重点从党支部的建设方面给出了具体的工作方法,这对高校更好
微型党课以新媒体为载体,以其灵活多样、见微知著、针对性强、参与度高等特点,逐渐成为高校党课创新建设的重要组成部分。如何将微型党课这一喜闻乐见、形象生动的党建辅助学
改革开放30多年来,我国玉米生产发展迅猛,多项栽培技术对促进我国玉米生产发展发挥了重要的作用。本文从品种、种植方式、施肥、灌溉、病虫草害防治、生长调控等方面系统总结
结合具体工程,对大跨度、大吨位吊车梁进行了合理的设计。确定了其截面型式,对其强度、稳定性及抗疲劳性进行了验算,并且对其焊接方法、构造措施进行了设计,提出了满足使用要
随着国家发展,在事业单位中文书档案管理工作越来越重要,为积极提高管理水平,本文进行几点阐述,首先分析其管理的重要性,随后具体阐述几点对策,旨在提高认识,以此为事业单位
党课作为每位党支部书记的必修课,是对党支部书记业务技能的基本要求,但在工作中,经常出现党课不能与时俱进,缺乏创新,形式单一、内容空洞乏味、听讲者不感兴趣的尴尬境地,党