论文部分内容阅读
信用风险评估技术对于金融机构具有重要意义。机器学习技术能显著地提高信用风险评估的准确度与适应性。本文提出三种新的基于机器学习的信用风险评估模型。提出基于特征信用和支持向量域描述的信用风险评估模型。首先计算特征信用即提取信用好的客户样本的主成分,然后将所有样本映射进特征信用所张成的子空间中,信用好的客户样本在特征信用空间中分布更紧凑,最后在变换后的样本数据上用支持向量域描述建立信用风险评估模型,该模型适用于在信用数据样本分布不平衡的情况下进行信用风险评估。实验结果表明,在信用数据样本分布不平衡的情况下,基于特征信用和支持向量域描述的信用风险评估模型能较好地检测出不良贷款。提出Weightly Selected Attribute Bagging集成学习方法,并用其建立信用风险评估模型,该模型的实现分为两个步骤。首先计算各特征分量的权重,然后构造特征分量的子集,权重越大特征分量被选入特征分量子集的概率越大,将训练样本依次映射进特征子集空间,在各特征子集空间中建立子分类器,最后各子分类器投票给出最终分类结果。这样可以删除掉一些冗余特征并且可以保持子分类器之间的多样性,从而能提高集成学习的效果。实验结果表明,相比于其他集成学习方法,Weightly Selected Attribute Bagging算法能更好地提高单个分类器的分类性能。提出基于核匹配追踪算法及核匹配追踪集成的信用风险评估模型。核匹配追踪是利用贪婪算法在由核函数构成的基函数字典中搜寻一组基函数的线性组合来逼近目标函数,该基函数的线性组合即为所要求解的预测函数。核匹配追踪集成是指利用多个核匹配追踪模型来投票决定最终的分类结果。实验结果表明,核匹配追踪算法可以被应用于信用风险评估,具有精度高、训练时间短以及解的稀疏性好等优点;核匹配追踪集成可以较好地解决大规模数据集的分类问题。