基于数据挖掘的客户流失预测实证研究

被引量 : 11次 | 上传用户:l342016022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,数据的分布往往是不平衡的,数据非平衡性问题已影响到多个应用领域如:客户流失、欺诈侦测、风险管理等。当前,随着数据挖掘研究的深入,非平衡数据挖掘正成为一个新的热点研究领域。本文研究的客户流失数据集具有典型的非平衡数据问题,客户流失对象为网络招聘行业的企业客户。全球网络招聘方兴未艾,据统计全球每天约有2000万条就业信息发布,3000多万人在互联网上发出求职简历,2006年全球招聘市场规模为172亿美元。在中国,2007年网络招聘市场规模为9.7亿元,2008年12.5亿,预计2009年将达到16.1亿元。网络招聘巨大的市场规模,良好的利润前景催生了新的专业化、行业性、地方性的招聘网站的诞生,同时也加剧了网络招聘行业的激烈竞争。针对客户流失问题,目前在电信行业、银行业、保险行业基于数据挖掘技术进行客户流失预测建模,并取得了丰硕的研究成果。而针对网络招聘行业面向企业客户流失问题的研究尚属起步阶段,本文分析了前人研究成果,对非平衡数据进行了介绍;对客户流失预测理论、研究方法和发展脉络进行了回顾与综述;支持向量机(Support Vector Machine,SVM)以其坚实的理论基础与良好的推广性能成为近几年来应用研究的热点,是一种流行的数据挖掘技术,本文对支持向量机进行了介绍;论述了我国网络招聘行业特征、市场规模及发展前景。最后通过国内某知名招聘网站企业客户特征数据以及客户在线行为日志数据,利用数据挖掘技术进行了客户流失预测建模及挽留策略的实证研究。本文的研究成果主要有:1)针对客户流失数据集的非平衡性与错分代价差异性问题,在传统SVM基础上,引入代价敏感学习理论,提出了代价敏感SVM的客户流失预测建模方法,通过实验验证了方法的有效性,对解决此类问题有一定的借鉴意义。2)针对客户流失预测数据集的高维特征约减问题,提出了主成分分析与神经网络的预测建模方法。通过实证研究,结果表明此组合方法降低了高维属性,简化了神经网络拓扑结构,提高了模型的预测性能。3)针对网络招聘企业客户挽留问题,分析了客户流失影响因素,基于K-means聚类技术对客户在线行为进行客户细分,并结合每类客户特征探讨了客户关系管理策略。
其他文献
<正>北京市医院管理局局长封国生2013年,一贯低调亲民的北京市医院管理局局长封国生,因在"相约守护"医院双体验活动中微服暗访北京同仁医院在网络上引发争议。面对交织着赞许
类钙钛矿型氧化物因催化活性良好、价格低廉且热稳定性好而在催化领域备受关注。本文工作采用不同方法制备了具有特定形貌的类钙钛矿型氧化物La2-xSrxCuO4 (x = 0, 1)和YBa2Cu3
海南作为中国最大的海洋省,岛礁资源丰富且具特色;随着国际旅游岛建设上升为国家战略和国家批准设立三沙市,为发展特色离岛游提供了难得的历史性机遇。笔者采用SWOT分析法,全
<正>2015年,精准医学在我国迅速升温,引起了国家高层以及医学界、科技界的专家教授广泛关注。今年3月,科技部召开国家首次精准医学战略专家会议,计划启动精准医疗计划,大力推
本论文主要完成了以下3方面的研究内容:1、硫化铜空心微球和空心微管的水热法制备及表征采用水热合成的方法,以五水合硫酸铜和五水合硫代硫酸钠为原料,在不采用任何表面活性
随着我国经济水平的不断提升和信息化建设的不断深入,网络作为当前社会流行的信息化代表之一,其安全受到了广泛的关注。尤其时常出现的系统漏洞、病毒及黑客威胁着网络安全,
<正> 抗日战争时期国民党通过实施“三征”、“限价”等粮食政策渡过了难关,共产党领导的陕甘宁边区以及其他一系列抗日根据地又是如何解决粮食问题的呢? 中共抗战时期的粮食
<正>港湾经济是指依托港口资源、岸线资源、海洋资源、海上贸易和工业及服务业的发展,在港区、岸线地域内建立和发展起来的经济模式。它不仅包括运输、装卸、仓储等港口物流
物资管理是企业管理的重要内容,是对企业生产过程中所需各种物资的订购、运输、储备、供应等所进行的计划、组织和控制。搞好物资管理,有利于合理化使用和节约物资,提高产品