【摘 要】
:
自从金融诞生以来,风险就伴随其左右,随着网络贷款平台的迅猛发展,信用风险问题层出不穷。2016年8月,监管部门发布了《网络借贷信息中介机构业务活动管理暂行办法》,为行业的规范发展指引了道路。无论是出于金融机构本身对于预期损失和收益估算的需要,还是基于监管部门对金融机构的要求,金融机构都需要对信用风险各项指标做预测。2004年颁布的《新巴塞尔资本协议》充分反映了一笔交易的信用风险既包含债务人的违约概
论文部分内容阅读
自从金融诞生以来,风险就伴随其左右,随着网络贷款平台的迅猛发展,信用风险问题层出不穷。2016年8月,监管部门发布了《网络借贷信息中介机构业务活动管理暂行办法》,为行业的规范发展指引了道路。无论是出于金融机构本身对于预期损失和收益估算的需要,还是基于监管部门对金融机构的要求,金融机构都需要对信用风险各项指标做预测。2004年颁布的《新巴塞尔资本协议》充分反映了一笔交易的信用风险既包含债务人的违约概率,也包含因违约造成的损失严重程度即违约损失率。
现行的信用风险预测模型大都以放贷初始时刻所能观测到的借款方特征如收入水平、信用分数等作为输入项X,以最终预测的违约概率与违约损失率作为输出项Y,然后选择合适的方法建立用输入项来预测输出项的有监督学习模型。本文立足于违约概率和违约损失率的研究,以美国最大的网络借贷平台lending Club公开数据为研究样本,创新性的提出了基于过程性可观测信息的信用风险研究框架。传统的信用风险预测模型通常是对放款之前历史数据的观测和收集,形成一个包含被观测的输入项X和输出项Y的数据集,从而以该数据集为训练数据完成对模型的训练和建立,但忽视了从观测到X至观测到Y的过程中可能发生的与X和Y密切相关的其它能被观测的事件即过程性可观测事件,很容易造成信息的不完全挖掘,降低算法的准确率。据此,本文构建了基于过程性可观测信息的信用风险研究框架并提出分层模型和混合模型。
相比传统预测信用风险的单一模型,本文提出的基于过程性可观测信息的信用风险研究框架无论对于数值型数据的预测准确度还是类别型数据预测准确度都能得到较大程度的提高,对信用风险领域关于借款方的风险评价,完善风控体系具有重要的理论意义和实践意义。
其他文献
稳健性优化设计的目的是在追求系统输出最佳性能的前提下,尽可能地使不确定性对于系统输出值的影响程度最低,在实际生产中具有十分重要的意义。在现代的产品优化设计领域中,仿真模拟已经成为了设计优化领域中必不可少的手段。随着科技不断发展,仿真能够达到的精度也不断提升,但与之伴随而来的是时间成本与资源消耗的剧增。稳健性优化设计的应用也掣肘于这些实际成本问题。 近似模型能够代替昂贵的仿真模拟,同时保证初始问题
图像修复是利用人们已知的信息来对图像中结构化信息的缺失进行恢复的过程。在图像修复中,人脸修复是运用范围最广,使用场景最多的应用之一。随着现代物质生活水平的飞速提高,电子产品的不断更新换代,人们对于人脸图像的要求越来越高,但现有技术无法令人满意,且对于损坏面部图像处理的功能也并未普及。因此,人脸修复算法的研究具有极大的商业价值和潜在的社会价值。 深度学习方法在人脸补全方面能够捕获图像更多的高级特征
随着我国经济的快速发展,空气污染问题也越来越严重,影响了人们的身体健康和日常活动,因此利用数学模型来研究空气污染指数有着重要意义。 本文首先给出了一个随机微分方程来描述空气中污染物的动力学模型,并使用Euler–Maruyama算法对方程进行离散化,利用2014年至2017年间武汉市空气质量指数的数据,通过极大似然估计得到了方程的参数,并对未来两年的空气质量指数进行离散化模拟。之后,将随机微分方
分数Brown运动(FBM)在长记忆过程的研究中占据了极其重要的位置,特别是随着随机积分理论的发展以及Black-Scholes期权定价理论的形成,FBM在时序分析中的地位日益突显,成为自然过程和金融市场中常用的数学模型,方兴未艾的Hurst指数估计方法也成为人们关注的重点。 本文主要研究了推广的复合分数Brown运动以及Hurst指数的贝叶斯估计方法。本文首先介绍了FBM的各种性质、模拟方法和
本文综合统计分析方法、空间基尼系数、泰尔指数、空间面板等方法对2000—2017年全球人类发展水平空间差异演化及影响因素进行研究发现:①从2000年到2017年,全球HDI平均水平从0.630上升到0.717,增长了13.78%。但是从全球平均HDI增速来看,全球人类发展水平增速逐步趋缓。HDI三个分项指数值其绝对值由高到低依次为寿命指数、收入指数和教育指数。教育指数虽然得分最低,但增长最快,表明
近年来,随着人们消费观念的改变和互联网科技的进步,消费金融行业得到了蓬勃发展,越来越多的企业涌入这一领域。然而,在消费金融覆盖人群越来越广的同时,贷款欺诈现象也愈演愈烈。因此,在放贷过程中,对客户信用的鉴别显得格外重要,这也是风险控制中的重要环节。传统的风险建模运用了用户的大量信息作为协变量建立统计模型或机器学习模型,用模型的输出来判定客户的信用水平。但是在有些情况下,用于建模的协变量包含的信息可
数据时代的到来使得数据逐渐上升为国家战略性资源,作为数据的重要载体,数据库的经济价值也日益凸显。与SNA1993不同,SNA2008将数据库与计算机软件剥离开来独立作为一项固定资产进行核算,此变革正是对其经济价值不容忽视的认可。然而,令人遗憾的是即便数据库的经济价值已不可小觑,目前几乎所有国家实践中均未将其纳入核算,有些国家甚至未将其纳入本国核算体系。究其原因,不外乎数据库核算理论有待完善以及统计
随着大数据时代的到来,海量数据的出现,数据缺失的问题越来越严重。缺失数据给应用研究和统计分析带来了很大困扰。传统的统计分析方法不能直接应用到缺失数据的处理中,不恰当的处理缺失数据,会导致错误的结论。因此,缺失数据的处理一直以来都是统计学的前沿和热点问题。本文考虑缺失数据下转换模型的统计推断问题,我们采用逆概率加权光滑最大秩相关估计方法来估计转换模型中的感兴趣参数,并对所提出估计量的渐近正态性和相合
针对信用卡申请评分中的数据不平衡问题,本文提出了一种可以用于连续变量与分类变量混合的混合数据的欠采样方法——UMBKER。该方法可以在基本保持原有多数类样本数据分布特性不改变的前提下,有效地去除多数类样本中较为冗余的样本,从而达到降低数据不平衡率、减少不平衡数据对模型影响的目的。 UMBKER算法是一种适用于混合数据聚类的KAMILA聚类方法与去冗余算法相结合的欠采样方法。该方法先对数据集中的多
2008年的金融危机,对全球经济造成振荡,与此同时,也让经济不确定性逐渐成为学者和政策制定者不容忽视的问题。不确定性的研究早已有之,但量化经济不确定性的困难阻碍了相关研究的进一步发展。现有的测度主要在国家的维度展开,测度的方法,根据所使用数据的不同,可以划分为基于统计指标的测度、基于主观意见的测度和基于媒体信息的测度。考虑到我国各省域之间的异质性以及宏观经济不确定性测度的研究趋势,本文旨在测度省域