论文部分内容阅读
近年来,人工智能、移动支付等新兴互联网技术以互联网金融形式逐渐拓展至传统金融领域,形成了传统商业银行和网络之间个人信贷业务相互竞争下的新型个人信贷背景,违约风险产生的因素不断增加。因此,基于因素空间理论,本文研究逆向因果分析法和Logistic回归算法的构建,将二者应用到个人信贷违约风险预测,研究内容:第一,对因素空间理论下逆向逻辑归纳的思想作出更明确的数学描述,用背景分布取代背景关系,提取出包含概率的推理规则,形成逆向因果分析法。利用逆向因果分析法,研究信用卡违约风险识别问题,提出银行信用卡违约逆向因果分析预测模型。该模型以银行信用卡数据为背景样本,提取相应的推理规则,并对待测样本进行违约识别,针对未被识别的样本,提出修正的银行信用卡违约预测模型,结合k近邻算法对不平衡数据集所导致的未识别样本进行二次识别,提升辨识度。在UCI数据集上的结果表明,逆向因果分析法预测信用卡用户违约结果准确、方法可行。同时,逆向因果分析法与k近邻算法的结合是一种很好的数据挖掘方法。第二,P2P作为个人信贷发展历史比较长、最具代表性的网贷平台,能够为探究个人信贷违约风险问题做强大的数据支撑,而Logistic回归在机器学习中扮演着重要角色,目前对于Logistic回归的研究主要停留在应用层面。因此,基于因素空间理论进一步加深对Logistic回归的解释,探究其背后因素的显隐关系,从因素显隐的视角下给出Logistic回归的合理表述,以美国Lending Club公司为例,选用2019年全年贷款人信息数据,建立P2P网贷信用违约Logistic回归预测模型。考虑到条件因素包含多种值态,引入One-Hot思想提升算法精度。选择准确率、召回率等评价指标对模型预测效果进行对比分析。模型结果表明Logistic回归可以对个人信贷的信用违约风险进行有效预测,也为新个贷背景下个人信贷违约风险的产生,提供更深入的解释。本文首次将因素空间理论应用到个人信贷违约风险评估领域,对信用卡和Lending Club平台两种实测数据,都取得了较好的预测效果。这不仅对于深入探讨因素空间理论具有重要意义,而且一定程度上,丰富了个人信贷违约风险研究方法,给信贷机构个人信贷业务模式的优化创新提供一些新思路。该论文有图20幅,表25个,参考文献86篇。