论文部分内容阅读
大数据时代,我国金融行业发展迅速,人民的消费理念、投资方式随着时代在不断的发生变化。人们由原来的储蓄观念转变为超前消费,促使中国的信贷行业蓬勃发展。同时个人信用风险问题也日益凸显,给信贷行业带来巨大的挑战。个人信用评估模型是一种基于数据挖掘技术来客观预测贷款客户的违约风险,在西方发达国家,从早期的统计方法到人工智能方法,相关技术的研究和应用已经趋于成熟。由于我国建立个人征信体系较晚,个人信用体系不健全,相关的研究较为落后。在此背景下,研究如何构建预测精度更高的个人信用评估模型和如何构建一套科学的指标体系对我国信贷行业发展意义重大。本文以个人信用评估组合模型为研究对象。首先对个人信用评估模型的研究进行文献综述。接着对Logistic模型原理、LASSO方法、SVM模型原理、组合方法作了介绍,其中针对SVM模型无法筛选变量的问题,将LASSO方法和SVM模型相结合,构造了LASSO-SVM模型,针对Logistic模型和LASSO-SVM模型预测精度有限的问题,构造了基于最小二乘法的Logistic和LASSO-SVM组合模型。其次总结分析了国内学者常用的指标体系,结合个人信用指标体系构建原则和本文信贷数据集确立了本文的个人信用评估指标。最后以UCI上的德国信贷数据集作为实证数据集,先对原始数据进行了预处理,然后依次建立了Logistic模型,LASSO-SVM模型和基于最小二乘法的Logistic和LASSO-SVM组合模型,其中LASSO-SVM模型的性能受到参数的影响,采用网格搜索的方式进行优化。选取混淆矩阵和ROC曲线为模型评估标准,将三个模型的输出结果进行对比,结果表明,基于最小二乘法的Logistic和LASSO-SVM组合模型的总分类正确率和AUC值比其它两个单一模型高,LASSO-SVM模型的总分类正确率和AUC比Logistic的高。从第一类分类错误率和第二类分类错误率来看,基于最小二乘法的Logistic和LASSO-SVM组合模型比其它两个单一模型低。通过以上的实证结果说明,基于最小二乘法的Logistic和LASSO-SVM组合模型完全可以应用于个人信用评估中。