非平衡样本下的贷款违约集成预测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhouqin1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,互联网和大数据技术不断更新迭代,加上大众的提前消费观念,社会上衍生出了种类繁多的贷款方式。银行作为主要的放贷机构,贷款是其金融主营业务收入的重要组成部分。但是贷款给银行带来利益的同时,银行自身也承担着潜在风险。一方面,由于各个银行之间的贷款业务是相互竞争关系,很难做到对客户的信息共享,这就可能导致银行对客户还款行为的预测存在偏差。另一方面,加上道德因素以及客户行为不确定性因素的影响,在某些突发状况下可能会导致客户违约的可能性变大。银行是国家能够平稳运行的一大重要环节,因此提高风险控制水平显得尤为重要。但是银行的贷款数据往往是不平衡的,如何挖掘少数类样本背后的信息更精确的预测客户的还款行为是有必要的。本文在非平衡样本的预测研究问题上,集主要精力于样本以及模型两个方面。(1)在样本的处理上:对于比例失衡比较严重的样本,之前有学者提出过采样以及欠采样方法。这两种方法只是单纯的复制或减少原有样本,并没有提供更多的信息,效果也较为一般。后来有学者提出SMOTE算法,它不再仅是对少数类样本的简单复制,而是通过一定的方法合成与少数类样本类似的样本,从而使整个样本变得更加健壮。但是SMOTE算法对少数类样本的合成具有盲目性。本文结合K-means算法与SMOTE算法,首先对少数类样本进行聚类分析,对于类别中心最远离于多数类样本中心的类不予合成新的数据;对于最靠近于多数类样本中心的类别和样本量较多的类别给予着重关注。最靠近于多数类样本中心的类别比较贴近边界,边界附近的样本能使分类器的分类效果增强,所以对于该类别样本应该给予扩充,但是又不能扩充太多,因为扩充较多使得扩充噪声点的可能性也会显著增加;同时也应对样本量较大的少数类进行扩充,因为其保留了少数类样本的主要信息。(2)在模型的处理上:本文选用了被广泛使用的三种模型,BP神经网络、逻辑回归、决策树。分别介绍了三种模型的理论基础,并且介绍了常用的集成学习方法。最后根据投票的方式,将上述三种模型融合成一个集成模型,并且分别比较了各个模型在传统SMOTE算法,以及改进的SMOTE算法上的表现。最终结果都表明改进之后的SMOTE算法要优于传统的SMOTE算法。
其他文献
催化氧化脱硝法是使用H2O2蒸气作为氧化剂,并在催化剂的作用下催化氧化NO为高价态的氮氧化物,随后通过吸收剂将反应产物进行吸收,从而实现脱硝的目的。该方法不仅在低温反应区域有较高的效率,而且还具有投资成本低、占地面积小和系统改造简单等优点。因此该技术可应用于大型电站锅炉的启停以及低负荷阶段,以及应用于各种工业炉窑中。在催化氧化脱硝领域,由于具有成本低廉、获取容易以及效率高等优点,Fe/TiO2催化
学位
众包设计服务模式为制造业的研发创新与产品的个性化、服务化发展提供了有效途径。知识产权是众包设计服务模式中的核心资源,由于缺乏有效把控,导致其面临着各种风险。如何准确识别、科学评估众包设计环境下知识产权风险,从而最大限度的降低知识产权风险所带来的影响,已成为促进制造业众包设计服务模式应用和发展的重要课题之一。鉴于此,本文结合国内外现有研究成果,综合运用众包设计理论、风险评估理论,围绕众包设计环境下知
学位
随着科学技术的发展,经济的全球化的日益加深,再加上今年新型冠状病毒肺炎疫情流行的影响,市场竞争更加激烈,企业经营业绩波动更大。国内经济政策由供给侧结构性转变为供需两侧同时发力。根据当前国际国内环境,市场环境将在未来一段时间愈加严峻。企业中高管理层可能会基于资本市场动机、契约动机和政治成本动机等,通过实施盈余管理来调节利润,而资产减值是实现盈余管理的重要手段。本文以建筑行业为例,通过研究其以存货减值
会议
2019年6月,《加快完善市场主体退出制度改革方案》明确提出了“最终建立全面个人破产制度”的目标。随后,各地法院陆续推出个人债务清理程序,探索开展“类个人破产”改革试点工作。2019年10月,温州市平阳法院顺利办结的蔡某个人债务清理一案引起了全社会的热议关注,该案被称为是最高法提出研究推动建立“个人破产制度”后全国首例具备个人破产实质功能和相当程序的个人债务清理案件。本文笔者以蔡某案为案例素材,提
学位
电子竞技运动近年来在我国取得了突飞猛进的发展,电竞职业选手和电竞青训运动员的规模愈来愈大。与快速发展的行业规模相比,电竞青训运动员在长期训练过程中的视健康和职业防护问题却令人担忧。电子竞技具备长时间连续作业的特征,大量的屏幕蓝光暴露使得这些低龄的青训选手,面临不可忽视的视疲劳困扰和潜在的蓝光损伤风险。国内外对蓝光长期累积造成视网膜损伤安全阈值研究尚无定论,电竞行业缺乏相关职业防护标准与建议,国内电
学位
生态环境损害应急处置费用追偿是指因突发环境污染事件导致大气、土壤等环境要素和植物、动物等生物要素的不利改变以及上述要素构成的生态系统功能的退化,造成严重的生态环境损害结果,地方各级政府或者相关单位垫付资金对已经发生的生态环境损害采取应急措施以防止污染扩散,事后由实际垫付资金的主体运用诉讼或非诉讼的方式对实际支出的应急处置费用进行追偿的法律救济措施。通过梳理现行法律中关于应急处置费用的规定,应急处置
学位
本课题基于国家某重大专项子项目,以一种可实现姿态调整的并联机构为研究对象,通过理论研究、仿真分析及实验对其运动学、动力学、控制策略展开研究,主要研究内容如下:首先,提出了一种3-PRR并联机构(PRR为一个移动副和两个转动副串联形成的机构),对其进行了机械结构模型概述介绍、模型简化;运用封闭矢量链法进行了逆运动学解算;基于虚功原理建立了3-PRR构型的动力学方程;并对机构进行了逆动力学和动力学仿真
学位
我国天然气进口量逐年攀升,液化天然气(LNG)已成为我国进口天然气的主要形式,采用罐箱运输具有多项优势,目前国内企业所做的LNG罐箱水上运输已有多项成功实例,但LNG罐箱内河运输安全问题依旧有待分析,定量风险评价方法作为安全分析的重要工具,得到风险值可以为风险控制提供依据。本文对LNG罐箱内河运输过程进行定量风险评价研究,相关工具包含了事故树、事件树分析法,模糊聚类方法,综合评判法,后果模拟软件E
学位
党的十九大报告中指出,“建立全面规范透明、标准科学、约束有力的管理制度”。推进行政事业单位内部控制建设,不仅是落实党中央决策部署的具体措施,也是全面深化改革的关键一步,和落实党中央全面从严治党和全面推进依法治国要求的必然之举,对于实现国家治理体系和治理能力现代化有着重要意义。从2016年全国行政事业单位内部控制制度建设工作正式启动后,各基层行政事业单位内部控制建设从实务来看,还存在不足之处,在制度
学位
随着我国经济的发展与市场开放程度的提升,信息不对称成为资本市场长期存在的普遍现象。而由于信息不对称以及代理问题的存在,使得融资约束已经成为阻碍当前我国企业经济发展的主要瓶颈之一。同时,社会责任业绩良好的企业拥有更低的权益成本,披露良好社会责任业绩的信号可以引起投资者的响应,显著增加投资者关注度,提高企业融资效率,缓解企业融资约束水平。然而,面对复杂多变的宏观环境以及频繁的政策变更,经济政策的不确定
学位