论文部分内容阅读
近年来,随着信贷市场不断发展,商业贷款特别是小额贷款迅速增长。区别于其他信贷形式,小额信贷和个人消费贷款具有无抵押、追回违约成本高、调查成本高等特点,因此需要有效的信用风险评估方法。以往的信用风险评估工作大多采用人工方式进行评估,但这种依赖于个体评估人员的评估方式效率低、准确性差、信用风险较大。随着小额贷款申请数量不断增加,人工信用风险评估方法已经无法满足实际的应用需求,因此急需研究快速、准确、客观、廉价的信用风险评估方法。基于这样的现状,本文提出和研究了基于机器学习的信用评估方法,并在以下几个方面开展了工作: (1)基于机器学习的信用风险评估算法比较和数据处理。常见的信用风险评估仅有一项分类,即批准贷款与否,仅凭这一项结果难以对申请人的信用状况进行完整的表示,因此本文设计了多种分类,并对真实的信用数据库进行了数据预处理,选取有效指标并对其进行量化处理,得到可用的信用数据库。在该信用数据库上,使用常见的机器学习算法针对不同的分类设计进行了实验验证。 (2)基于RANSAC-ANN的小额贷款信用风险评估模型。在小额贷款的信用数据采集过程中,易出现错误的环节较多,导致信用数据样本中存在大量噪声,这些噪声影响了传统算法的性能。针对该问题,本文提出基于随机抽样一致性和神经网络(RANSAC-ANN)的小额贷款信用风险评估模型。该模型基于随机抽样一致性思想,使用BP神经网络模型替换原有的评估模型,利用重复迭代和BP神经网络的判断准则来剔除噪声数据并得到有效数据集,在有效数据集上建立BP神经网络模型,以达到最终提高分类器识别率的目标。 (3)基于PCA和SVDD的个人信用风险评估模型。常见的信用风险评估方法多为二类分类器,而实际应用中,信用数据的二类分布并不均衡,传统算法难以区分出数量少的类别。针对该问题,本文提出基于主成分分析和支持向量域描述的个人信用风险评估模型。首先,使用主成分分析计算出信用数据中的正类用户(信用记录较好的用户)样本数据的主成分;然后,利用得到的特征向量将全部信用数据样本映射进新的特征空间;最后,在新的样本空间中建立支持向量域描述模型,并得到分类器,用于评估新样本。 在多个实际信用数据库上的实验结果表明,本文所提出的算法能有效处理含噪声的数据,能适应信用样本分布不均衡的数据,并且具有较高的预测准确率。