基于支持向量机的个人信用评估特征优化研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:pyw520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国内个人信贷业务的不断展开,一套科学而且自动的信用评估系统显得极为迫切,为此,许多学者致力于运用统计学方法及最优化理论解决这个问题。支持向量机模型结合了统计学与最优化理论,在满足结构风险最小化的原则下得到分类模型,故本文所研究的个人信用评估应用中的特征优化方法均以支持向量机的分类正确率作为优化标准。并且考虑到样本数据混叠严重的情况,本文利用了K近邻法对SVM模型进行改进,提出了Mul-SVM-KNN模型(见第5.4节)。   由于个人信用数据特征较多存在相关性及冗余,而且有些维度仅为了银行对申请者的常规验证,对其信用评估并无作用,因此特征提取和特征选择是优化信用评估模型的关键步骤。本文首先采用主成分分析方法对取自UCI机器学习库的两个信用数据集进行特征提取,用得到的综合指标进行分类模拟实验。接着,本文设计了两种特征选择算法,即AUC-Sort特征选择方法(见第4.2节)和MG特征选择方法(见第4.3节),其中,AUC-Sort方法计算按各个特征的信息增益大小依次添加进候选特征集得到的ROC曲线下的面积AUC,并选择具有最大AUC的特征集作为选择后的特征集;MG方法则是利用互信息对特征进行预筛选后,借助遗传算法对筛选后的特征集进行优化从而得到最适合信用评估的特征子集。   经过实证分析,本文提出的Mul-SVM-KNN模型对两类样本点混叠较严重的情况下还是比较有效的,而且经过AUC-Sort方法和MG方法优化后的特征子集对分类精度的提高也贡献甚大。
其他文献
本篇硕士论文由四部分组成.第一章为预备知识.首先介绍了非线性数学物理方法的研究背景,主要是针对非线性波及孤立子理论的物理问题展开了简要的探讨,进而简要介绍了近年来的
学位
对于一般的随机微分方程,若漂移系数及扩散系数为Lipschitz连续函数,则该方程的唯一解是平方指数可积的。   本论文主要考虑带有一个多值极大单调算子的多值随机微分方程。
本文研究了动力系统中同宿轨的存在性问题,包括二阶系统,Hamilton系统和Dirac方程.在一些新的或更宽泛的条件下我们得到了上述问题同宿轨的存在性,主要内容安排如下:   第一章
本文针对三元离散神经网络模型的稳定性与分岔进行讨论。研究的课题主要有:平衡点的稳定性、周期解的存在性以及分岔方向等问题。对于模型的研究主要分为两个方面:一方面是不具
分数阶微分方程是数学领域里一个非常重要的分支,并且微分方程的正解问题已经发展了很长的时间.本文分别讨论了参数影响下奇异的分数阶微分多点边值问题正解的存在性和奇异的
由于非线性振动现象存在于各个领域,因此研究非线性振动系统是至关重要的.而非线性振动系统是比较复杂的系统,求解其准确解也变得困难的,因此,许多学者提出了大量方法分析其近似
小学数学一直都是我国的重点学科,数学与人们的生活息息相关,学好数学对今后的生活和工作打下坚实基础,同时也是锻炼和掌握知识技能的一个过程,因此小学数学教学也越来越受到
数字图像的真实性、完整性认证技术是多媒体安全保护的重要研究课题。本文根据图像认证的需求,结合数字图像的特点,研究了用于数字图像真实性、内容完整性认证的图像数字签名
在原材料采购中,价格波动被看作是主要的供应链风险之一。基于许多原材料持续剧烈地价格波动,本文在竞争的环境下将关注价格波动对产品采购的影响。以及基于绿色商品与普通商品Bertrand竞争,考虑社会福利最大化下的税收补贴问题。本文的结构安排如下:第一章,绪论部分,研究背景、现状以及本文的主要研究成果和创新点。第二章,本文考虑的情景是两家公司使用同一种原材料来生产相互替代产品。首先,公司之间致力于采购竞
工业机器人的防护是工业机器人应用的重要组成部分。在研发自动焊枪工业机器人芳砜纶防护面料的基础上,探讨了铝胶涂层面料的基本性能,研究了铝胶涂层关键工艺对面料阻燃性能