论文部分内容阅读
当今社会,个人的信用状况越来越受到重视,在整个信用体系中起着基础性的作用,支撑着整个信用体系的发展,决定着市场经济能否顺利进行良性的循环。信用评分技术是通过数学方法研究个人信用状况的技术,具有处理时间短,成本低,处理标准具有一致性、规范化及准确率高的优点。在个人信用评分领域,评分方法按照来源可以分为统计学方法,运筹学方法以及人工智能技术方法三类。在这些方法中线性分类方法具有解释性好,运算简单,稳定性高的优点。 本文主要基于线性分类方法对个人信用评分进行分析和实例研究。实证数据源自德国的个人信用数据,首先将定性化的描述处理为定量化的数据,然后选取部分数据作为建模样本,分别基于MCLP(多目标线性规划)、判别分析法和Logistic回归算法建立个人信用评分模型。由于初始的MCLP信用评分模型没有达到完全分类的效果,仍有部分数据处于分界线上不能确定其所属类别,因此需要对初始的评分模型进行改进。一种改进方法是对MCLP算法中的不确定参数b进行实例研究,取得能弥补模型缺憾的特殊值b=0,另一种改进方法是对取随机b值的MCLP模型提出用DEA算法进行进一步的分类,以达到优化初始模型的目的。本文最后运用保留样本法和ROC曲线法对这三类线性信用评分模型的效果进行比较研究。在保留样本法中,基于MCLP的信用评分模型分类的总正确率是最高的,总错误率和第一类错误率是最低的。第二类错误率最低的的是基于Logistic回归的评分模型。综上所述,基于MCLP的信用评分模型正确划分信用良好的客户比率较高,而基于Logistic回归的信用评分模型将信用不良的客户区分出来的比率较高。ROC曲线显示基于MCLP和Logistic回归模型的分类效果的曲线在对角线之上,且曲线下面积大于0.5,说明基于这两种分类方法的个人信用评分模型的分类效果与实际的分类情况较符合。 本文的创新点有两个,一个是对MCLP的信用评分模型提出两种改进方法,另一个是对个人信用评分领域的线性分类模型的性能进行比较研究。主要目的在于比较分析线性分类算法在个人信用评分领域应用的性能,为以后的研究提供新的思路。本文虽然对MCLP算法提出了改进的思路,但是对于本次研究中的特殊取值b=0,并不能给出理论解释,因此关于b取值的研究可以作为MCLP算法的后续研究方向。