基于不平衡数据的多种采样方法的信用评分模型研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:zk0529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,我国信贷市场正在不断朝气蓬勃地发展,这不仅促进了我国经济发展,同时也给金融市场带来一定的风险和挑战。因此,我们可以充分利用信贷市场中客户的信用数据特征来创建有效的信用评分模型,这既利于金融信贷机构识别交易中的不良贷款从而减少损失,也对金融市场的良性发展起到了一定的推动作用。此外,构建一个稳定可靠的信用评分模型固然十分重要,但考虑到信用评分数据的不平衡特点,因此还需要注意对不平衡数据的处理,从而建立预测性能较优的信用评分模型。本文就信用评分领域中的数据不平衡问题展开了研究,利用德国信贷数据集分别对比了LR、KNN、NB、SVM、RF和XGBoost分类模型在11种采样算法下的模型分类性能。同时也对六个分类模型建立了空白实验,即评估默认参数模型下的预测性能,并利用网格搜索方式对模型进行了参数调优。基于本文所研究的数据集得出以下结论:(1)使用网格搜索进行参数调优后的模型分类性能明显优于只使用默认参数的单一模型。文中列出了六个分类模型的部分最优参数,实验发现调参后模型的AUC、F-score和G-mean三个评价指标值均有所提升,说明在对信用评分数据集进行建模时,调整模型的参数对模型分类性能的提升有较大帮助。此外基于本文使用的数据集,参数调优后AUC值排名前三的单一模型分别为SVM、LR和XGBoost模型。(2)使用采样方法处理过的模型分类性能明显优于原始默认参数下的模型。实验结果表明,经过大多数采样方法处理过的模型,其AUC值会高于默认参数下的模型。这是因为原始数据进行采样处理之后,要么减少多数类样本数要么增加少数类样本数或者结合两种方式,从而降低数据集的不平衡程度,增加了分类模型的预测性能。因此,针对信用评分领域数据的不平衡特点,可以考虑先使用相关采样方法来降低数据的不平衡程度,从而提升模型的分类性能。(3)基于本文数据集,大多数经过欠采样方法处理的模型的分类效果是优于过采样方法处理的模型。本文实验结果表明,与多种采样方法相结合的六个分类模型中AUC值最高的分别为RUS-LR、RUS-KNN、ENN-NB、ENN-SVM、Tomek Links-RF和RUS-XGBoost模型,并且RUS、ENN和Tomek Links均为欠采样方法。因此基于德国信用数据集,可以考虑使用欠采样方法对数据做平衡处理。
其他文献
近年来,伴随银行等金融机构个人信贷业务的不断发展,金融欺诈问题也逐渐显现。因此,如何根据用户数据分析预测用户行为,制定相应策略优化客户分类,为管理者提供更科学的贷前信用风险评估具有一定的现实意义。目前个人信贷风控方式已由传统的人工审核转向基于机器学习与深度学习,大多数银行等金融机构当前采用基于单一模型的风险评估方式。随着行业不断发展,单一模型性能逐渐满足不了日益复杂的欺诈场景。本文针对个人信贷风险
猪伪狂犬病是养猪业中比较常见的一种急性、热性传染病。该病是由伪狂犬病毒感染造成的。此病主要侵害仔猪和妊娠母猪,成年猪一般为隐性感染。此病的临床症状以高热、呼吸道症状及神经症状为主,给我国养猪业造成严重的经济损失。本文从病原学、流行病学、临床症状、病理变化、诊断鉴别和综合防控进行阐述,以期给相关工作者带来帮助。
<正>言语交际是至少在两个人之间进行的,借助语言或文字传递信息、交流思想感情的活动。在语文教学中,言语交际特指师生、生生之间的言语活动。正如李维鼎先生在《语文言意论》中提出“语文”即“言语”,“语文课”即“言语课”。语文的本质就是言语,语文教学是指向言语交际的。一、语境还原,增进学生言语交际的具体体验由言语作品到语境生长的逆向转换过程就叫“语境还原”。学生凭借作品中的语言描述,
期刊
目的 调查二胎孕妇孕期焦虑、抑郁状况,并分析其影响因素。方法 抽取2018年1—12月在湖州市妇幼保健院检查分娩的二胎孕妇309例作为研究组,另选取同期检查分娩的初产妇111名作为对照组。发放一般情况调查表、焦虑筛查量表、抑郁筛查量表,对比两组孕妇的焦虑、抑郁状况,并分析焦虑抑郁的影响因素。结果 研究组孕妇的焦虑、抑郁发生率分别为24.92%、16.18%,均显著高于对照组对应值(11.71%、7
随着经济全球化以及我国金融改革进程的不断深入,我国商业银行的消费信贷业务发展迅速,信贷业务在我国商业银行业务和利润配比上所占份额越来越大。然而,商业银行在向客户发放贷款时,往往存在严重的信息不对称问题。这一问题的出现,使得银行难以分辨客户的信用好坏,进而增加了银行所面临的信用风险。因此,我国商业银行的运营模式亟须从当前以增加客户规模为基础的信贷模式,向以提高客户质量为基础的信贷模式进行转变。在这一
债券作为一种证券除了是一种融资手段,对于企业来说也是能够证明其经济权益的法律凭证。然而随着我国金融市场不断发展,有越来越多债券产品涌入债券市场,同时,违约的债券也不计其数,自2014年债券打破刚性兑付后,债券违约现象出现的频率越来越高。其中,不乏有评级为“A”级及以上的债券也出现了违约情况。对债券进行评级在一定程度上能够起到预估企业信用风险的作用,但由于我国信用评级市场不健全、建设相对缓慢等原因导
语文教学应该以培养学生的言语运用能力,即语用能力为根本目的。当前很多教师在语文教学时过于注重对语言本身的静态分析,脱离语言运用的实际,使学生不能学以致用。本文旨在探索语文阅读教学中,教师如何冲破传统教学模式的桎梏,从切合言语运用实际的角度出发,化“静”为“动”,发展学生言语交际能力。
英语是初中教育教学体系中的重要组成部分,英语教学意义重大。“双减”政策下,要提高初中英语教学效率,需要英语教师更新教学理念,创新教学方法,打造出生态化、立体化的英语课堂。文章结合教学工作经验,从构建民主课堂、培养学习心态、提高学习能力及完善教学评价四个角度,浅谈“双减”政策下如何提高初中英语课堂教学效率。