论文部分内容阅读
当今社会,人工智能和互联网行业在不断快速发展,人们的经济消费模式逐渐由传统消费模式转变为信用经济模式,信用经济模式主要表现于个人消费信贷,其中信用卡消费、住房按揭、汽车贷款、教育贷款等都属于个人消费信贷。在消费信贷热不断升温的形势下,为保障银行和其它金融部门的安全设立了一种关于人身金融权限的划定模型,即信用评分模型。该模型指根据消费者的信用历史资料,利用机器学习或数据挖掘方法,得到不同等级的信用分数,根据消费者的信用分数,来决定消费者可以持有的信贷额度,从而保证还款等业务的安全性。信用评分模型主要对消费者进行信用评估,信用评估技术在处理信贷业务上具有快速、高效、标准的特点,信用评分模型的研发一方面可以保障金融秩序稳定,减少信用评估成本,改善信贷决策的一致性、速度和准确性,另一方面也有利于提高商业银行的授信工作效率及扩大消费信贷的发放。因此,开发出一个有效的信用评分模型对稳定银行业务发展及降低消费者信贷违约风险具有非常重要的作用。在现有信用评分模型中,国内外研究学者大多研究点聚焦在对传统机器学习方法进行改进或者对消费者的信用特征进行研究,即采用特征选择方法,然而基于传统机器学习方法构建的信用评分模型对大量的、不规则的信用数据来说,缺乏稳定性和精确度。针对现有信用评分模型存在的问题,本文结合网格搜索、数据预处理、信用矩阵、加权抽样、特征语义、混合组特征选择等方法来构建信用评分模型,并对消费者信用进行预测分析。本文的研究工作如下:(1)针对基于传统随机森林算法构建的信用评分模型对冗余特征敏感和输入参数不易确定的问题,提出基于随机森林的改进型信用评分模型。传统随机森林算法虽然有算法结构简单、容易实现等特点,但也存在输入参数不确定、对信用数据中冗余噪声数据较敏感等缺点。针对以上问题,本文结合网格搜索方法对随机森林算法参数进行优化及提出信用矩阵构建、加权抽样方法对训练数据进行抽取,同时,为提高其预测精度,结合相应的特征选择方法来提高基于随机森林构建的信用评分模型的预测性能。(2)针对现有利用特征选择方法构建的信用评分模型最终预测精度低、特征子集间稳定性弱的问题,提出基于混合聚类和支持向量机相结合的混合信用评分模型。对信用数据进行预处理的基础上,从多维视角进行研究,提出一个新的混合组特征构造策略及基于特征组对信用特征进行特征转置,以提高模型的预测精度和稳定特征子集间的稳定性,同时提出特征语义,构建雷达图对信用特征进行解释,以挖掘出更多有用信息。本文利用UCI数据库及网上公开的真实信用数据集进行验证,并和现有信用评分模型进行对比。实验结果表明,本文构建的信用评分模型在预测精度和稳定特征子集间稳定性上具有更好的表现。