基于代价敏感和集成学习的个人信用评估模型研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:snailswuya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个人信用评估对信贷机构降低经营风险,增加营业收益具有非常重要的作用。随着大数据技术的迅猛发展和普及,快速且精准的数据挖掘以及智能学习技术成为信用评估的主流手段。信用评估可以看作是一个二分类问题,即区分客户是违约客户还是未违约客户,但不同类型的客户被识别错误给信贷机构所造成的损失是不一样的,这一特点要求评估模型不仅具有较高的分类准确率,而且也要考虑不同类别间数据样本的误分类代价。本文在充分考虑信用评估业务实际需求的基础上,提出了一种基于代价敏感和集成学习的个人信用评估模型,在提高分类模型准确率的同时可以有效降低误分类损失。主要研究内容包括:首先,考虑代价敏感因素,构建了一种基于代价矩阵的误分类度量算法。不同类别客户的误判会给贷款机构造成不同程度的损失,如何在分类模型中反映出不同类别间的误分类代价,是要解决的重要问题之一。基于此,构建了以代价矩阵为基础的误分类度量方法:将未违约客户误判为违约客户的代价成本用贷款金额乘以贷款利息(即银行损失的机会成本)来表示,将违约客户误判为未违约客户的成本用贷款金额乘以违约损失率来表示,违约损失率数值可以通过最小化贷款数据集中期望收益和实际收益之间的差值来获得。将分类模型作为MetaCost代价敏感算法的底层分类器,对模型进行训练得到分类模型对数据样本的分类概率,将其乘以误分类代价矩阵得到样本归属于某类别的代价,根据代价最小原则,模型对数据样本的类别进行重标记,实现对不同数据样本的分类代价敏感。其次,提出一种基于代价敏感和集成学习的个人信用评估模型(CSL-Stacking),并通过实验验证该模型的有效性。如何从众多机器学习模型中选择合适的算法,是信用评估领域中另一个重要研究方向。本文通过文献总结和实验分析,评价和比较了九种常用分类器在信贷数据集上的表现,从三个评估维度,六个具体数值型的指标来分析模型的分类性能,并借助层次分析法确定这六个数值型指标的权重,然后对指标值按照各权重进行加权求和,得到的结果作为模型分类性能的综合评价结果并结合各模型之间的差异性指标来进一步确定集成模型CSL-Stacking的基分类器,通过实验效果分析最终选择极端随机树、LightGBM、BP神经网络、梯度提升树和逻辑回归模型作为其基分类器。选定好CSL-Stacking模型的基分类器后,将信贷数据代入到CSL-Stacking模型中进行训练和测试。最后,选用Lending Club平台的数据作为实验数据集代入模型进行训练和测试,实验结果显示所构建模型在该数据集上的分类准确率达到96%,对违约客户的召回率提高到97.6%,误判总成本也降低到270。在与单一模型和其它主流的三种信用评估模型的对比实验中,本文所构建模型CSL-Stacking体现出了其分类效果的优越性。本文的主要贡献在于综合了代价敏感和集成学习的思想,对个人信用模型评估中的代价度量、分类准确度以及代价敏感等问题提出相应算法和解决方案,丰富了该领域的研究思路。同时提出的模型和算法在分类准确度、误判总成本等性能指标上有较大程度的提升。对于金融和信贷机构而言,微小的性能提升就能给其带来巨大的收益。因此,本文研究有助于提高银行、金融信贷等机构的信用风险管理水平,研究结果对相关机构业务决策具备一定的现实意义和应用推广价值。
其他文献
预测和识别具体的国际贸易关系及其演化,可以帮助各个国家和地区知晓当前的贸易形势和明确未来的贸易发展趋势,使各国各地区在提升自身贸易水平的同时降低贸易风险。尤其是在贸易摩擦、新冠肺炎疫情等不稳定因素存在的背景下,整体把握国际贸易关系及其变化情况,有助于实现贸易的高质量和可持续发展,有助于促进本国的经济发展,有助于全球经济的整体复苏。当前,国际贸易网络的相关研究中很少对具体的贸易关系进行预测,且没有考
学位
随着司法体制的深化改革在国家政策层面铺展开来,运用机器学习、人工智能技术的司法判决预测(Legal Judgment Prediction,LJP)逐渐成为实现司法智能化的重要环节。从全国司法系统来看,各地纷纷出现的自助判案系统与云法官系统等智慧司法技术慢慢的被纳入司法审判活动中,先进技术与司法实践活动的紧密结合,不仅对智能技术的迭代更新、发展引领具有推动作用,而且将大大减轻司法实践活动中案件数量
学位
以股指期货为代表的金融衍生产品的出现推动了中国资本市场的繁荣发展,经历了2015年股指期货市场异常波动后,股指期货波动率预测与风险管理研究尤为重要。如何提高股指期货波动率的预测精度,建立有效的风险管理策略,对国家资本市场的发展、监管部门管控金融风险以及个人投资者制定投资策略都具有重要意义。近年来,大量学者利用高频数据研究股票价格等金融数据,应用到股指期货波动率的较少。在波动率预测方面,除了较为传统
学位
金融衍生品交易策略研究是建立在自身的定价基础上的,二者密不可分。期权作为金融市场中重要的衍生产品,也是较为活跃的一类合约,学者们一直对期权定价的问题重点关注。因此关于如何对期权进行有效的定价,提高期权价格预测的精准度,从而制定相关的交易策略都显得至关重要。合理的定价和预测对投资者规避风险、套期保值,对维持市场的平稳运行,进一步提高市场效率都具有重要的参考意义。随着期权定价理论的不断发展,衍生出了许
学位
随着5G技术和社交媒体的发展,网络视频已成为信息传播的主要载体之一。当用户通过信息检索了解某话题时,往往会返回大量杂乱无章的视频,使得用户只能在有限时间内观看较少的内容,降低了信息的获取速率。同时,嘈杂的视频可能导致用户易造成对某一话题或事件的片面认知。因此,基于网络视频的事件挖掘相关研究对于热点话题事件梳理及舆情导向具有重大意义。网络视频一般包含视觉信息和文本信息。对于视觉信息,视觉检测方法如以
学位
我国经济社会飞速发展的同时,生态破坏、环境污染问题日益突出。自生态环境损害赔偿制度实行后,取得了多方面进展,赔偿磋商是其中一个重要机制,但关于磋商的规定仍然不够细化,因此建立赔偿磋商机制解决此类问题备受各方关注。区别于以往文献多探讨磋商的法律性质、救济途径以及程序性规定,本文从博弈的视角对磋商过程进行分析。赔偿标准是否科学合理,决定了磋商能否顺利进行以及能否得到兼顾赔偿双方利益的结果。本文梳理了国
学位
近年来,随着“新冠”疫情的爆发,在互联网上有关于该突发公共卫生事件的关注和讨论日增不减,而如何了解和把握此类事件的网络舆情,以便更好的引导舆情朝着积极方向发展,也引发了众多研究人员的思考。本研究围绕突发公共卫生事件网络舆情展开,研究具体事件背景下的网民观点演化规律,结合了观点动力学模型,预训练语言模型,图卷积网络等多种方法对观点演化过程进行建模。由于突发公共卫生事件本身所具有不确定性和危机性,同时
学位
随着现代银行间市场的发展、全球经济不确定性的深入,银行间形成了复杂的债权债务关联,该关联性为银行风险提供了扩散途径。同时,我国银行体系将面临着错综复杂的外部因素,金融体系的创新也给银行系统带来了另外的挑战和风险,迫使银行从传统向金融科技转型。另外,银行系统利用信用违约互换等方式让其关联变得更加错综复杂。因此,分析银行同业之间的关联关系,研究银行系统的风险传染机制,有着至关重要的现实作用。针对此,本
学位
股票停牌是基于提升股票价格发现效率、抑制股票剧烈波动、消除信息不对称的初衷所设立的交易机制,在保护投资者利益和稳定交易秩序上发挥了重要作用,被世界各国主要证券市场广泛接受和实施。我国于1998年开始实施股票停牌,其大致经历了信息不完全对称下的发展、证券市场发展下逐步完善和国际接轨中的探索与改进三个发展阶段。虽然监管机构在三个阶段中对股票停牌进行了多次制度变革,但停牌种类繁多、频次较高的问题始终所为
学位
近年来,国家出台“三线四档”等政策,增加房地产行业的银行借贷门槛,在这种背景下,房地产违规信贷现象屡禁不止。罚单的数量和金额表明监管机构对违法违规行为的惩治决心和力度,但也从侧面说明“罚单式”监管模式的效果欠佳。房地产开发过度依赖银行信贷,不仅危及自身,也会将房地产市场的隐患传导至银行系统,进而引发系统性金融风险。因此,商业银行房地产信贷风险亟须得到有效评价和监管,研究该问题对于引导资金脱虚向实,
学位