基于机器学习的信用风险评估技术若干研究

被引量 : 0次 | 上传用户:talen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用风险评估技术对于金融机构具有重要意义。机器学习技术能显著地提高信用风险评估的准确度与适应性。本文提出三种新的基于机器学习的信用风险评估模型。提出基于特征信用和支持向量域描述的信用风险评估模型。首先计算特征信用即提取信用好的客户样本的主成分,然后将所有样本映射进特征信用所张成的子空间中,信用好的客户样本在特征信用空间中分布更紧凑,最后在变换后的样本数据上用支持向量域描述建立信用风险评估模型,该模型适用于在信用数据样本分布不平衡的情况下进行信用风险评估。实验结果表明,在信用数据样本分布不平衡的情况下,基于特征信用和支持向量域描述的信用风险评估模型能较好地检测出不良贷款。提出Weightly Selected Attribute Bagging集成学习方法,并用其建立信用风险评估模型,该模型的实现分为两个步骤。首先计算各特征分量的权重,然后构造特征分量的子集,权重越大特征分量被选入特征分量子集的概率越大,将训练样本依次映射进特征子集空间,在各特征子集空间中建立子分类器,最后各子分类器投票给出最终分类结果。这样可以删除掉一些冗余特征并且可以保持子分类器之间的多样性,从而能提高集成学习的效果。实验结果表明,相比于其他集成学习方法,Weightly Selected Attribute Bagging算法能更好地提高单个分类器的分类性能。提出基于核匹配追踪算法及核匹配追踪集成的信用风险评估模型。核匹配追踪是利用贪婪算法在由核函数构成的基函数字典中搜寻一组基函数的线性组合来逼近目标函数,该基函数的线性组合即为所要求解的预测函数。核匹配追踪集成是指利用多个核匹配追踪模型来投票决定最终的分类结果。实验结果表明,核匹配追踪算法可以被应用于信用风险评估,具有精度高、训练时间短以及解的稀疏性好等优点;核匹配追踪集成可以较好地解决大规模数据集的分类问题。
其他文献
普通高中通用技术学科学业水平测试标准及试卷结构技术指标的构建是依据《基础教育课程改革纲要(试行)》的基本精神和《普通高中技术课程标准》(通用技术部分)。总体而言,普通高中
介绍生物质炭化技术的基本原理、主要特征和不同分类,论述我国生物质炭化技术装备方面的最新研究进展,分析典型炭化技术与装备的工艺过程与结构原理,在此基础上探讨我国在生
文章以田野调查所掌握的第一手资料为基础,通过对调查资料的分析和研究,从邵阳布袋戏的戏台所具有的风格特色出发,结合邵阳布袋戏的艺术特点对其戏台的设计、构造和搭建进行
JDL型铜铝导体连续退火炉,采用了新型的管件加热元件,可对退火导体作一次传导加热和辐射加热。与井式退火炉相比,它具有热效率高、节电、启动升温快、投资少、适用退火导体范围广、
2011年,一场针对百度文库的回合大战,又一次将网络著作权侵权中网络服务提供者的责任问题推向风口浪尖,而百度文库在辩解中援引的"避风港原则"则将这一法律概念重新引入了人
近年来,"退休返聘"已经成为我国社会经济生活中一种不可回避的现象。活跃在社会经济生活各个领域中的各类退休人员退而不休,以其特殊的优势获得了用人单位的青睐。不可否认的
油菜是经济价值高、发展潜力大的油料作物,也是蛋白质、饲料、蜜源和能源作物,油菜籽的干燥和储存联系油菜高产栽培和油脂深加工综合利用。本文在分析油菜籽干燥特点和主要干
<正>第一章总则第一条为做好事业单位岗位设置管理工作,建立适合事业单位各类人员特点的岗位管理制度,实现事业单位人事管理的科学化、规范化、制度化,根据人事部《关于印发
目前,电力工程接地网设计中仍大量使用降阻剂作为主要的降阻措施。文章从降阻剂的降阻原理入手,分析计算降阻剂在不同大小接地网的降阻效率。通过计算分析表明,在线路杆塔接