数据驱动的消费金融违约风险预测方法研究

来源 :合肥工业大学 | 被引量 : 5次 | 上传用户:zhangdong1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
消费是最终需求,促进消费对释放内需潜力、推动经济转型升级、保障和改善民生具有重要意义。基于此,商业银行、消费金融公司以及互联网金融企业在开展传统个人金融业务的同时,积极拓展信用卡、消费信贷和P2P借贷等多样化消费金融业务,助力推动消费市场不断扩大、消费结构持续优化。近年来,随着“互联网+”战略的深入发展,海量金融数据爆发式增长,使得信用数据呈现复杂性、多样性、异构性等特点,传统的金融数据分析方法多是采用模型驱动的策略,无法有效应对个人违约风险预测问题,导致信用违约事件频发,各类金融机构均承受着违约风险。鉴于此,亟需通过引入最新的机器学习算法,完善个人违约风险预警机制,促进消费金融市场健康、可持续发展,这对于丰富和完善消费金融信用风险管理体系具有重要的理论意义和实践价值。本文在对现有消费金融与违约风险的理论方法进行总结的基础上,凝练了消费信用数据所存在的非均衡样本、小数据以及高维特征等问题,系统研究了多场景下数据驱动的消费金融违约风险预测方法,充分运用深度学习算法,构建了基于异质集成学习、特征迁移学习以及集成深度学习的消费金融违约风险预测方法,通过实验对比分析验证了所提方法的准确性,最终解决了信用数据所呈现的问题。本文的具体研究内容和创新点如下:(1)基于异质集成学习的信用卡违约风险预测研究。分析了信用卡消费数据的非均衡样本对个人违约风险预测的显著影响,提出了一种能够克服非均衡样本问题的渐进式异质集成学习框架;构建了基于XGBoost、神经网络和逻辑回归算法的信用卡违约风险预测个体分类器,并研究了基于排序特征和离散特征的缺失值处理策略;在此基础上,构建了基于非均衡样本的信用卡违约风险预测方法。使用包括12,000组样本、122维特征的信用卡消费数据开展了对比实验研究,结果显示基于非均衡样本的信用卡违约风险预测方法与对比方法相比,具有较佳的预测精度,并且能够很好的解决非均衡样本问题。(2)基于特征迁移学习的消费信贷违约风险预测研究。剖析了消费信贷新获客时冷启动对违约风险预测所导致欠拟合的现象,提出了一种能够解决小数据问题的特征迁移学习框架,设计了面向特征和样本的相似度估计算法,迁移了与消费信贷业务相似的部分信用卡数据;构建了基于GBDT、XGBoost和LightGBM算法的消费信贷违约风险预测个体分类器;在此基础上,提出了基于小数据的消费信贷违约风险预测方法。使用包括40,000组信用卡样本和4,000条消费信贷数据所组成的消费信用数据开展了对比实验研究,结果表明基于小数据的消费信贷违约风险预测方法比基准方法具有较高的AUC性能得分和敏感度指标评分,并且能够很好的解决小数据问题。(3)基于集成深度学习的P2P借贷违约风险预测研究。分析了P2P借贷信用数据呈现高维特征对违约风险预测造成维数灾难的情况,提出了一种能够应对高维特征问题的集成深度学习框架;构建了基于深度神经网络算法的P2P借贷违约风险预测分类器,采用了随机搜索策略对超参数进行优化,以此设计并配置完成了网络的内部结构;同时,研究了信用数据中的非均衡样本现象,提出了深度神经网络模型的Bagging集成策略;在此基础上,构建了面向高维特征的P2P借贷违约风险预测方法。使用包括15,000组样本、1,138维特征的P2P借贷信用数据开展了对比实验研究,结果显示面向高维特征的P2P借贷违约风险预测方法与对比模型相比较,可以正确区分违约客户,并且能够很好的解决高维特征问题。综上所述,当前我国消费金融领域整体风险水平可控,但是作为新兴的消费金融形式其经营时间较短,风控建模水平有限,坏账控制能力还有待时间验证;并且多头借贷、恶意骗贷等信用风险和欺诈风险始终是消费金融领域面临的挑战,风险控制仍将是消费金融企业未来不变的主题。鉴于此,全文以数据风控作为消费金融风控体系的基础,融入“数据+算法+风控模型”的思想,能够真正有效的将风控系统量化衡量,打造真正的智能金融减少人工干预降低风险减少损失。对于从管理视角丰富和发展消费金融违约风险预测的方法体系,推动消费金融领域信用风险管理水平的提升,具有重要的理论意义和应用价值。新一代人工智能技术正在成为引领金融科技革命和产业变革的战略性技术,需要构建满足跨界融合、人机协同、群智开放等特征的新型风险预警机制,进一步推动信用卡、消费信贷、P2P借贷等消费金融服务产品创新。与此同时,随着互联网应用的不断深入以及人工智能技术的不断进步,文本、图像、音视频、社交关系等多类型数据即将成为构建客户画像的重要依据,对消费金融违约风险预测模型的多模态跨媒体感知、融合与推理能力提出新的更高要求。
其他文献
近年来,随着平板电脑、智能手机、Kinect体感交互设备等的迅速普及,自然交互方式越来越流行,开拓了数据库技术的一个新的研究方向。文中以手势交互为代表,分析了传统数据库在
发生在河东盐池的黄帝大战蚩尤的故事,现存文献见载于《孔子三朝记》和《梦溪笔谈》。《孔子三朝记》说:“黄帝杀之于中冀,蚩尤股体异处,血入池化卤,使万世之人食焉。则解之盐池也
报纸
目的 探讨老年支气管肺癌患者伴深部真菌感染的危险因素及防治手段。方法 对我院1997年1月-1999年12月,收住院的38例老年肺癌伴深部真菌感染的临床资料进行分析。结果 真菌
采用生态学的研究方法,从系统性、整体性和平衡性三个范畴中对体育的生态内涵进行阐释,进而彰显体育在生态文明社会中的重要作用。通过对现有相关研究中存在问题和误区的甄别和
本文通过对长春市石头口门和新立城两大水源地及长春市五座净水厂现状供水分析,对长春市供水安全提出了个人见解:由于两座水库分别对应不同水厂,属于单一供水格局,供水安全保
大学语文是高等院校的公共基础课,然而在当今社会大学语文却遭遇尴尬处境,为了更好的解决这一问题,我们可以通过对《徐中玉:大学语文三十年》一文的解读中得到一些启发,找到一
<正>2003年,无论是SARS的肆虐,还是的禽流感的局部流行,都直接威胁到了广大人民群众的身体健康和生命安全,那时,是一群白衣天使不顾个人的安危,挺身而出救死扶伤, 甚至他们中
会议
为提高铁路客运站服务水平,满足日益增长的旅客需求,构建铁路客运综合业务自助终端。铁路客运综合业务自助终端整合了铁路客运站非常态的零散业务,包括乘意险购买、银通卡取
随着科学技术的进步,遥感找矿法逐渐被应用到矿区工作之中,该方法是一种通过遥感途径对工作区的控矿因素、找矿标志及矿床的成矿规律进行研究并从中提取矿物信息来帮助工作人
目的观察压力管理对白大衣性高血压患者的临床效果。方法选择经动态血压监测诊断为白大衣性高血压的妇科手术患者100例,按随机数字表分为观察组和对照组各50例。对照组采用常