基于电信运营商大数据的用户信用评分卡的设计与实现

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:abcd_11840
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国征信行业起步较晚,目前个人信用体系存在着数据来源不全面、覆盖人群不广泛、预测效率不高等问题。而电信运营商作为宽带和移动互联网的流量提供者,在业务运营中积累了大量的用户数据,涵盖了生活的方方面面,且可信度非常高,这些海量、稳定、快速增长的数据为运营商进行征信服务提供了得天独厚的条件。另外一方面,随着电信业务规模不断扩大,业务产品不断创新,对于电信用户的个人信用评价成为减少坏账风险,提升业务收入的重要环节。针对这些问题和需求,本文基于电信用户数据进行特征选择与建模,参考金融领域的信用评分机制,构建了电信用户信用评分卡模型。主要工作如下:(1)多维度真实业务数据的预处理。基于电信运营商的真实业务数据,对数据集进行了预处理,提出了一种处理不平衡数据集的融合算法,该算法综合考虑了过采样和欠采样的优缺点,实现了近邻点欠采样和自适应综合过采样这两种算法的融合。经过实验验证,相比传统的不平衡数据集处理方法,融合算法的处理效果更好。(2)提出了一种新框架下的特征选择方法。针对获取的电信用户数据进行探索性分析,根据分析结果对特征进行了单列处理和选择,提出并行寻优的特征选择方法,经过实验验证,在特征比较少的情况下,新方法可以在不降低后续训练模型的性能的前提下保留最多的有用信息。(3)设计构建和实现了基于评分卡形式的信用评估模型。利用常用的机器学习算法构建电信用户信用评估模型并进行实验对比分析,综合考虑预测能力和可解释性选择逻辑回归算法实现电信用户信用评估模型,并创新性地将金融领域的评分卡模型应用到电信领域,实现了从模型到评分卡的转换。(4)设计和实现了具扩展性的信用评分原型系统。结合具体业务场景和需求,设计多个功能模块,方便后续的扩展和业务应用。综上所述,本文经过数据预处理、特征处理等工作,选择了逻辑回归算法构建了电信用户信用评估模型,并将银行客户评分卡模式应用到电信领域,为运营商进行风控和信控提供了可行的思路。
其他文献
1909年是丰富多彩的一年,这一年革命暗潮涌动、改革风生水起。清政府组织成立国会、资政院,准许地方咨议局召开;新型学堂逐渐走上正轨,学制和教学内容日益完善等。各种改革活动积
历经多年发展与实践,长三角旅游一体化已在许多领域和更深层次上呈现出良好局面,特别是《长江三角洲区域一体化发展规划纲要》的正式颁布,使长三角区域各城市的分工定位更加
从民商法的角度分析海难救助报酬制度的法理内涵,该制度所遵循的“无效果,无报酬”原则体现了区别于民商法中“禁止好管闲事”原则的特殊性。从民商法角度考察海难救助报酬制
农民工在城市融入过程中在形象上容易受到歧视,本文提出如下假设即如果农民工在形象上有所改观,人们对其态度是否会改善进行了田野调查并进行实验,实验证明了农民工在外貌上的确
目的:通过实验观察额日敦乌日乐对坐骨神经的治疗效果,为临床治疗提供依据.方法:Wistar大鼠20只随机分组为模型组和给药组.用止血钳钳夹坐骨神经,造模后1d,3d、5d,7d、14d,21d、24d
本文叙述了风景园林绿化的重要性,分析和总结了当前风景园林工程管理中存在的问题作了深入的分析,并着重在施工方面对其提了针对性的解决方案。
2010年1月国务院发布《推进三网融合的总体方案》,开启了我国三网融合的发展元年,下一代互联网、下一代广播电视网、3G网络和WIFI技术的发展,带来了更优质的网络、更大的带宽和
探索编制自然资源资产负债表是生态文明体制改革的基础性制度建设,海洋渔业资源资产负债表是进行海洋渔业资源资产核算的一项基本内容。目前,海洋渔业资源资产负债表编制的理
<正>本文分别研究了纳米二氧化硅(SiO2)填充POE以及PEB的动态流变行为,通过熔融共混的方式得到了SiO2/POE以及SiO2/PEB复合材料,随着填充SiO2含量的增加,两种体系的复合材料
班级是学生最重要的成长环境之一,班级建设的好坏直接关系到学生的发展状况。班集体的特色创建,就是努力创建班级特色文化,以"文化"为切入点,以文化教育人、感染人、熏陶人。