基于支持向量机的个人信用风险评估研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:tornadohearwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们消费观念的转变,我国信贷业务逐年增加,但随之暴露出来的信用风险问题也越来越严重,为减少信贷机构的损失,需要找到一个科学有效的方法进行个人信用评估,依此对客户进行“好”与“差”的判别。关于个人信用评估方法的研究,从早期的定性分析法到定量分析法再到如今的组合优化方法,学者们一直都在寻找各方面性能俱佳的个人信用评估模型。目前单一的个人信用评估模型研究进步空间有限,学者们通常会选用组合方法将单一模型优势互补。关于客户的信用数据往往是高维的,甚至存在一些不相关的特征,在当今广泛运用的机器学习算法当中,这些不相关的特征通常会影响分类器的准确度,所以进行特征选择必不可少。本文针对信用评估中样本数据含有噪声、指标多的复杂特点,将随机森林融合支持向量机(RF-SVM)模型引入到个人信用评估问题中,以获得更高的预测精度。在通过对大量支持向量机分类模型研究的基础上,发现支持向量机具有全局最优、易推广性等特点,但传统支持向量机模型难以解决筛选重要性程度较高指标的问题。因此,本文以德国某商业银行的真实信用数据作为实验样本进行实证研究,将实验样本划分为训练集和测试集,利用随机森林的特征选择算法,对所选用的实验样本进行特征选择以保留重要性程度较高的特征,结果得到了一个包含11个特征的新实验样本集,然后将按照该方法筛选后的11个特征样本集输入到支持向量机模型当中。最后,为验证本文所提出模型的预测结果可信度,将其与个人信用评估领域认可度最高的Logistic回归模型及单独的全变量支持向量机模型进行结果比对,从模型的准确率及稳定性两方面对其进行分析,发现Logistic回归个人信用评估模型的准确率为76.2%,但其稳定性远不及另外两类模型;而全变量的支持向量机个人信用评估模型准确率为75.8%,虽然其第一类误判率及稳定性与RF-SVM模型水平相当,但准确率过低;本文构建的的个人信用评估模型准确率为76.5%,且稳定性也较好。因此,由以上结果表明,本文构建的随机森林融合支持向量机模型在解决个人信用评估问题中预测效果较好,同时也具有较好的稳定性,值得推广。
其他文献
本文以广州市普通高校的在校大学生为研究对象,主要采用问卷调查法对篮球运动给高校体育文化带来的影响进行了调查与分析。其目的为促进高校校园体育文化的发展和积极创新篮球运动等提供一定的理论依据和参考价值,也为篮球运动与高校校园体育文化的良性互动、以及更好的促进校园体育文化氛围的形成,产生深远的意义。主要的调查研究结果为:1.广州高校学生对篮球运动的传统观念已经普遍认同,对形成的现代观念较认同的,主要有篮
电晕放电作为直流输电中一个不可忽视的技术问题,其微观机理尚未被透彻研究,其特性与电极形状、极间距等多种因素息息相关。同时,负电晕放电广泛应用于静电除尘等工业领域,电除尘器内部的尘埃颗粒运动情况也相当复杂。因此,研究电极形状及极间距对负电晕放电及放电区域内颗粒物运动的影响有着重要意义。本文在前人研究基础上,建立了基于泊松方程和流体动力学方程的负电晕放电仿真模型,耦合了合理简化的光电离项,定量研究了负
二次供水作为城镇供水系统的“最后一公里”,是关系民生的重要基础建设工程,与小康社会下人民的美好生活及绿色建筑节能减排的社会需求密切相关。为促进串联叠压供水方式在高层住宅中的应用,减少住宅建筑供水能耗,保证用户正常用水需求,本文以高层住宅串联叠压供水方式为研究对象,结合数理论证、算例验证、软件模拟等方法,对供水方式进行节能理论分析及泵组运行优化两方面研究,得出了串联叠压供水方式的节能原因及泵组运行优
垂直救援技术作为最近几年矿难应急救援领域发展起来的一种新型救援手段,慢慢开始在全世界范围内尝试,并得到成功运用。垂直救援技术是通过快速钻井建立应急救援通道,对被困人员实施救援。就目前垂直救援技术的实际应用情况来看,由于其在救援过程中无法准确获知井下信息,从而有效指导救援过程的顺利进行,保证人员安全性。因此及时监测垂直救援井整体动态变化信息,才能更好的帮助地面人员快速高效的实施救援。本文通过研究目前
在“智能制造”时代要求下,采用基于机器视觉的测量技术实现金属工件在机测量,对提高检测效率、加工效率和精度具有重要的实际应用价值。在目前的加工过程中,对工件进行测量时需拆卸工件并二次装夹和重定位,会出现人工测量尺寸效率和精度较低等问题,所以目前的人工测量尺寸不能较好且高效率地完成测量任务。在高新技术产业不断发展的今天,企业需要一种对工件尺寸实时在机测量的方法,并需准确地测量出关键尺寸。机器视觉技术发
精确的辐射屏蔽计算分析为各类核装置的设计及运行提供理论基础与支持,离散纵标法(SN)是屏蔽计算中常用的算法之一。SN方法通过数值离散处理输运方程的角度和空间变量,导致射线效应和数值扩散效应,引起通量密度的非物理的振荡分布,严重影响了屏蔽计算的精度和可靠性。特别是对于存在空腔的孤立点源屏蔽问题,离散误差更加明显。本课题针对带有空腔的孤立点源屏蔽问题,研究多次碰撞源方法,有效地控制离散误差,并采用区域
近年来,随着科技的发展和汽车产业的兴盛,人们对汽车的需求量逐步加大,由此产生了一系列的交通问题,比如交通拥堵、交通事故等。车联网作为智能交通体系的核心技术可有效提高交通运作效率,并保障车辆的安全出行。车载自组网络中各节点通过无线通讯的方式进行信息传输,且拓扑结构变化快,其通信链路脆弱且容易受到各类安全威胁,车载网络中的信息安全问题成为当今学术研究的主要内容之一。本文具体研究工作如下:首先,对车载网
随着电力系统发展,低压配电网损耗和电能质量扰动问题愈发严重,这种现象应该得到重视。一方面,由于电压等级低、线路分布广、电气设备多,低压配电网的损耗率一直较高。另一方面,分布式电源以及大量非线性负荷的渗透,给配电网带来较为严重的谐波问题;同时,低压配电网的三相不平衡和电压偏差大的问题一直存在。电能质量问题会加剧配电网线路及设备损耗,增大低压配网节能降损难度。为了厘清电能质量扰动与理论损耗计算和线损统
山西省大宁县位于晋西黄土高原,其较为复杂的地质环境伴随剧烈的人类工程活动,使得县域内发育了许多滑坡地质灾害。开展滑坡地质灾害危险性评价是有效防治滑坡灾害的前提,评价的结果可以有针对性的指导城镇地质灾害防治工作。本研究在吕梁山区城镇地质灾害调查项目的基础上,实地调查出208处滑坡灾害点,结合大宁县1:5万地质资料对研究区的滑坡灾害在大宁县县域内的发育特征和地质背景进行分析,使用混合高斯聚类模型优化的
非能动系统的使用使核电厂安全系统在设计上进行了简化,降低了系统设备冗余度,同时充分利用自然驱动力,不依靠能动设备驱动,减少电源、机械和阀门故障引起的系统运行失效,降低了人因失误发生的可能性,极大的提高了系统运行的可靠性和经济性。而自然循环的建立受到很多因素的影响,大气作为最终的冷源及热阱,如果气象条件的变化导致系统依赖的自然驱动力偏离了设计值,自然循环无法建立,导致非能动安全壳冷却系统(PCCS)