基于互联网数据的个人信用风险评估的研究与应用

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:gongwj123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
消费金融的蓬勃发展让人们体验到信用为生活带来的便利,然而基于传统数据的征信模式在互联网经济形式下的弊端也逐步显露,即传统数据具有真实性无法核实、数据非动态变化、覆盖维度不全等局限性。而互联网数据是用户基于互联网产生的真实行为记录,且动态变化,能有效弥补传统数据的不足,因此进行基于互联网数据的个人信用风险评估的研究具有应用价值和现实意义。而利用互联网数据进行个人信用风险评估的核心问题在于两点:第一,如何基于互联网数据建立有效的个人信用风险评估的指标体系?传统数据来自用户申请表,因此传统的指标体系设计简单并固定,而互联网数据涵盖广泛,因而从海量的互联网数据中构造有价值的指标则需要进行大量的数据分析与挖掘工作。第二,如何构建适用于互联网数据的个人信用风险评估模型?目前大多研究均是基于传统数据建立的风控模型,而互联网数据具有噪音大、维度高、数据稀疏等特点,仅基于传统的算法构建风控模型可能无法取得良好的效果。因此本文也主要基于以上两点进行了实证研究,主要工作内容及创新点如下:(1)提出并建立了基于互联网数据的个人信用风险评估指标体系。首先分析传统指标体系的不足,从互联网数据的特点出发,提出了基于互联网数据的指标评估体系架构,进而在此架构上运用实际的互联网数据构建了包含上万个特征的指标体系,并利用空置率过滤、IV统计量原则对指标体系进行了筛选与优化。(2)构建了基于互联网数据的个人信用风险评估模型并取得不错的效果。通过分析Logistic回归、决策树、随机森林等个人信用风险评估方法的优缺点,选择传统统计学方法Logistic回归和非参数模型GBDT分别建立了基于互联网数据的个人信用风险评估模型,模型初步取得良好效果,其中Logistic回归模型在测试集上的AUC指标为0.71、KS指标为0.35,GBDT模型在测试集上的AUC指标为0.73、KS指标为0.37。(3)提出了一种基于GBDT与Logistic回归融合的个人信用风险评估模型。通过对比分析Logistic回归与GBDT单一模型的优缺点、互补性以及在互联网数据上的分类预测表现,利用GBDT离散化特征和构建组合特征的原理建立了基于GBDT与Logistic回归融合的互联网个人信用风险评估模型,并通过实证研究表明融合模型在分类预测精准度及泛化能力方面较单一模型均有明显提升。
其他文献
思想政治工作是以马克思列宁主义、毛泽东思想为指导,解决人们的思想、立场、观点问题。提高人们认识世界和改造世界的能力,是动员人们自觉地为实现当前和长远的革命目标而奋斗
工业废水是目前我国水资源污染的源头之一,在可持续发展战略下,污水的治理已经成为我国城市化进程和生态文 明建设的必要路径,所以工业废水处理装置则显得十分重要。目前,针
基于国内对冰雪资源的不断开发、利用和整合,在我国北方形成了一种特殊类型的资源型产业,即冰雪产业。它是一种新兴的产业,并且逐渐成为国民经济体系中区域经济发展的一个新
高校钢琴教学的主要目的是培养中小学音乐教师,所以,教师要将钢琴教学与学生就业联系在一起,不仅要侧重于基础知识,而且要侧重于钢琴技巧、方法以及弹奏和演奏,也要注意加强
腹膜透析是治疗终末肾病的重要手段,正确合理治疗并采取积极有效的护理措施,对改善患者生活质量、延长生命、推迟肾移植时间具有重要的临床价值。2000年-2004年,我院腹膜透析治
实践能力是专业硕士研究生培养的重要要求,针对控制工程专业硕士研究生培养过程中存在的实践能力不足的问题,提出控制工程专业硕士研究生实践能力培养体系的构建,包含三方面
工艺美术新专业的创办在围绕教学工作开展与教学质量提高过程中都会面对许多新的问题。对学生工艺设计能力与技能提高方面,单项课堂实践训练往往不能满足学生个体发展需要,还
党和国家高度重视高校思想政治工作,公安院校由于培养对象、培养内容具有特殊性,学生思想政治水平直接关系到公安专门人才的质量,关系着公安队伍的发展。在面对培养对象当前
开放教育学员面授课出勤率低的主要原因有:工作、家庭与学习矛盾;班级班风学风建设不足;部分学员学习态度不端正;部分课程期末考试容易通过;部分课程吸引力不够。提高开放教育
目的:评价布托啡诺对硬膜外麻醉后寒战的疗效。方法:将90例ASAⅠ~Ⅱ拟在硬膜外麻醉下行剖宫产术的产妇随机分为三组,每组30例,A组静脉注射布托啡诺1mg;B组静脉注射哌替啶0.4mg/k