基于机器学习的个人信用风险评估模型研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zjlyqgf888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信贷市场不断发展,商业贷款特别是小额贷款迅速增长。区别于其他信贷形式,小额信贷和个人消费贷款具有无抵押、追回违约成本高、调查成本高等特点,因此需要有效的信用风险评估方法。以往的信用风险评估工作大多采用人工方式进行评估,但这种依赖于个体评估人员的评估方式效率低、准确性差、信用风险较大。随着小额贷款申请数量不断增加,人工信用风险评估方法已经无法满足实际的应用需求,因此急需研究快速、准确、客观、廉价的信用风险评估方法。基于这样的现状,本文提出和研究了基于机器学习的信用评估方法,并在以下几个方面开展了工作:  (1)基于机器学习的信用风险评估算法比较和数据处理。常见的信用风险评估仅有一项分类,即批准贷款与否,仅凭这一项结果难以对申请人的信用状况进行完整的表示,因此本文设计了多种分类,并对真实的信用数据库进行了数据预处理,选取有效指标并对其进行量化处理,得到可用的信用数据库。在该信用数据库上,使用常见的机器学习算法针对不同的分类设计进行了实验验证。  (2)基于RANSAC-ANN的小额贷款信用风险评估模型。在小额贷款的信用数据采集过程中,易出现错误的环节较多,导致信用数据样本中存在大量噪声,这些噪声影响了传统算法的性能。针对该问题,本文提出基于随机抽样一致性和神经网络(RANSAC-ANN)的小额贷款信用风险评估模型。该模型基于随机抽样一致性思想,使用BP神经网络模型替换原有的评估模型,利用重复迭代和BP神经网络的判断准则来剔除噪声数据并得到有效数据集,在有效数据集上建立BP神经网络模型,以达到最终提高分类器识别率的目标。  (3)基于PCA和SVDD的个人信用风险评估模型。常见的信用风险评估方法多为二类分类器,而实际应用中,信用数据的二类分布并不均衡,传统算法难以区分出数量少的类别。针对该问题,本文提出基于主成分分析和支持向量域描述的个人信用风险评估模型。首先,使用主成分分析计算出信用数据中的正类用户(信用记录较好的用户)样本数据的主成分;然后,利用得到的特征向量将全部信用数据样本映射进新的特征空间;最后,在新的样本空间中建立支持向量域描述模型,并得到分类器,用于评估新样本。  在多个实际信用数据库上的实验结果表明,本文所提出的算法能有效处理含噪声的数据,能适应信用样本分布不均衡的数据,并且具有较高的预测准确率。
其他文献
每学期的排课问题是教务管理软件设计中的重点和难点。在组合优化范畴内,排课属于NP完全问题。本文在查阅大量相关文献的基础上,对现有解决NP完全问题的算法进行了分析和优化,结
本文针对传统WebServices的缺陷,结合入侵容忍的思想,对通用的入侵容忍架构进行改进,利用冗余性多样性等技术,设计出一个针对WebServices的多层、多代理入侵容忍体系架构,该架构可
光学分子影像技术是成像领域近年来发展起来的新生力量,其通过分子探针标记病变区域或重要组织,基于光学成像连续动态的采集光学分子信号。作为一种客观评价病变组织的成像方式
本文围绕构建基于JOGL的三维图形可视化插件的相关技术展开论述,首先对OpenGL程序的基本结构进行分析,并比较JOGL的两种不同编程框架——回调和主动渲染,进一步阐述构建插件模型
本文提出了感知器型神经网络的改进方法,包括新的学习算法、学习终止条件判断方法、样本筛选方法和类别之间不平衡问题的解决方法。将图形芯片实现通用计算的技术应用于神经网
随着集成电路制造工艺的发展,如何保证电路设计的功能正确性已经成为至关重要的问题。功能验证技术主要分为模拟和形式化验证。形式化验证技术目前还不适用于大规模复杂设计的
网络安全技术是Intemet及信息技术发展的基石,已成为计算机领域重要的研究课题之一,它从解决网络安全问题的实践过程中不断拓展和丰富。在继众多网络安全技术(如VPN技术、加密
本文结合蒙古语信息处理的实际需要,开展了面向蒙古语的词法分析研究,并介绍了蒙古语切分标注系统的实现。主要在以下几个方面做出了相应的工作: 1.对蒙古语信息处理技术的研
无线Mesh网络(WirelessMeshNetworks,WMN)是Adhoc网络技术在民用领域中的进步发展。使用WMN网络技术,用户可以不依赖于现有的网络基础设施,用较低的成本快速部署一个可覆盖较大
“中间业务平台系统”是某商业银行处理全国各省中间业务的新一代联机交易处理平台系统,该平台系统是基于中间件的三层次软件体系结构,针对银行中间业务需求变化频繁的特点,要求
学位