论文部分内容阅读
消费是最终需求,促进消费对释放内需潜力、推动经济转型升级、保障和改善民生具有重要意义。基于此,商业银行、消费金融公司以及互联网金融企业在开展传统个人金融业务的同时,积极拓展信用卡、消费信贷和P2P借贷等多样化消费金融业务,助力推动消费市场不断扩大、消费结构持续优化。近年来,随着“互联网+”战略的深入发展,海量金融数据爆发式增长,使得信用数据呈现复杂性、多样性、异构性等特点,传统的金融数据分析方法多是采用模型驱动的策略,无法有效应对个人违约风险预测问题,导致信用违约事件频发,各类金融机构均承受着违约风险。鉴于此,亟需通过引入最新的机器学习算法,完善个人违约风险预警机制,促进消费金融市场健康、可持续发展,这对于丰富和完善消费金融信用风险管理体系具有重要的理论意义和实践价值。本文在对现有消费金融与违约风险的理论方法进行总结的基础上,凝练了消费信用数据所存在的非均衡样本、小数据以及高维特征等问题,系统研究了多场景下数据驱动的消费金融违约风险预测方法,充分运用深度学习算法,构建了基于异质集成学习、特征迁移学习以及集成深度学习的消费金融违约风险预测方法,通过实验对比分析验证了所提方法的准确性,最终解决了信用数据所呈现的问题。本文的具体研究内容和创新点如下:(1)基于异质集成学习的信用卡违约风险预测研究。分析了信用卡消费数据的非均衡样本对个人违约风险预测的显著影响,提出了一种能够克服非均衡样本问题的渐进式异质集成学习框架;构建了基于XGBoost、神经网络和逻辑回归算法的信用卡违约风险预测个体分类器,并研究了基于排序特征和离散特征的缺失值处理策略;在此基础上,构建了基于非均衡样本的信用卡违约风险预测方法。使用包括12,000组样本、122维特征的信用卡消费数据开展了对比实验研究,结果显示基于非均衡样本的信用卡违约风险预测方法与对比方法相比,具有较佳的预测精度,并且能够很好的解决非均衡样本问题。(2)基于特征迁移学习的消费信贷违约风险预测研究。剖析了消费信贷新获客时冷启动对违约风险预测所导致欠拟合的现象,提出了一种能够解决小数据问题的特征迁移学习框架,设计了面向特征和样本的相似度估计算法,迁移了与消费信贷业务相似的部分信用卡数据;构建了基于GBDT、XGBoost和LightGBM算法的消费信贷违约风险预测个体分类器;在此基础上,提出了基于小数据的消费信贷违约风险预测方法。使用包括40,000组信用卡样本和4,000条消费信贷数据所组成的消费信用数据开展了对比实验研究,结果表明基于小数据的消费信贷违约风险预测方法比基准方法具有较高的AUC性能得分和敏感度指标评分,并且能够很好的解决小数据问题。(3)基于集成深度学习的P2P借贷违约风险预测研究。分析了P2P借贷信用数据呈现高维特征对违约风险预测造成维数灾难的情况,提出了一种能够应对高维特征问题的集成深度学习框架;构建了基于深度神经网络算法的P2P借贷违约风险预测分类器,采用了随机搜索策略对超参数进行优化,以此设计并配置完成了网络的内部结构;同时,研究了信用数据中的非均衡样本现象,提出了深度神经网络模型的Bagging集成策略;在此基础上,构建了面向高维特征的P2P借贷违约风险预测方法。使用包括15,000组样本、1,138维特征的P2P借贷信用数据开展了对比实验研究,结果显示面向高维特征的P2P借贷违约风险预测方法与对比模型相比较,可以正确区分违约客户,并且能够很好的解决高维特征问题。综上所述,当前我国消费金融领域整体风险水平可控,但是作为新兴的消费金融形式其经营时间较短,风控建模水平有限,坏账控制能力还有待时间验证;并且多头借贷、恶意骗贷等信用风险和欺诈风险始终是消费金融领域面临的挑战,风险控制仍将是消费金融企业未来不变的主题。鉴于此,全文以数据风控作为消费金融风控体系的基础,融入“数据+算法+风控模型”的思想,能够真正有效的将风控系统量化衡量,打造真正的智能金融减少人工干预降低风险减少损失。对于从管理视角丰富和发展消费金融违约风险预测的方法体系,推动消费金融领域信用风险管理水平的提升,具有重要的理论意义和应用价值。新一代人工智能技术正在成为引领金融科技革命和产业变革的战略性技术,需要构建满足跨界融合、人机协同、群智开放等特征的新型风险预警机制,进一步推动信用卡、消费信贷、P2P借贷等消费金融服务产品创新。与此同时,随着互联网应用的不断深入以及人工智能技术的不断进步,文本、图像、音视频、社交关系等多类型数据即将成为构建客户画像的重要依据,对消费金融违约风险预测模型的多模态跨媒体感知、融合与推理能力提出新的更高要求。