Logit回归模型算法在典当公司信用风险度量中的应用

来源 :管理会计研究 | 被引量 : 0次 | 上传用户:sdmligq1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】典当公司作为专门从事发放抵押、质押贷款,以现金货币借贷为主要服务业务并兼任从事抵押商品出售市场的中介组织,是一种非典型的金融机构。当前,典当公司在以互联网金融为代表的小额借贷市场严峻的竞争局面下,为借款人给出接近甚至超出抵押、质押物价值的额度的借款额度,并降低所收的息费率,以此保住自己的市场份额。但这些营销手段大大提高了典当公司所面临的信用风险,也使典当公司对信用风险施行有效的度量和监控的需求更为迫切。
  本文通过一家较为典型的典当公司(A公司)信用风险度量模型构建的案例,结合典当公司的业务特点、需求和具体案例公司的样本,建立了信用风险度量的逻辑回归模型,并通过交叉验证和实践运用,得到了使用有效的评价。该研究结果可为提供借贷金融服务的典当行业,建立有效的信用风险度量方法提供一定的参考,模型选取的参数可为提供第三方征信服务的公司提供借鉴。
  一、引言
  我国典当行业从 1987 年成都市华茂典当服务商行成立至 2005 年颁布《典当管理办法》,历经近二十年的发展,整个行业的外部监管和内部的运作管理已趋于成熟。全国典当行业监管信息系统显示。截至2017 年 12 月底,典當余额 963.7 亿元,与上年相比增加 6.4 亿元,同比上升仅为 0.7%。根据中国人民银行网站公布的数据,2017 年社会融资规模存量为 174.64 万亿元,典当余额占社会融资规模存量的 0.01%,较上年基本持平。随着小微金融业务在国内的兴起,尤其是互联网金融的迅速发展,对传统金融借贷行业造成了较大冲击和影响。在这种竞争局面之下,典当公司只有为借款人给出更高的贷款,以逼近甚至超出抵押、质押物价值的额度并提供更优惠的息费率,才能守住自己的市场份额。然而,一味降低利率,提升给出的借款本金,会有收入无法覆盖违约成本的风险,需要有信用风险度量模型来保障风险审核质量,提供动态和及时的信用风险防控措施。
  本文将以提供抵押类借贷服务的A典当公司为案例研究对象,以其客户样本为基础,建立信用风险度量模型,找到能显著影响信贷行业的信用风险度量的通用变量,并对结果进行分析和检测。为提供借贷金融服务的典当行业以及其他从事抵押、质押类借款服务公司建立有效的信用风险度量方法提供一定的借鉴,同时为提供第三方征信服务行业的服务和产品设计提出有价值的参考。
  二、理论分析和文献回顾
  信用风险度量最早能追溯到 20 世纪 60 年代,各研究机构与金融机构采用不同的算法,研究出一系列具有统计学意义的信用模型算法,有些方法的原理发展至今已超过 80 年,历经静态到动态、定性到定量、简单到复杂的迭代发展里程。
  (一)机器学习算法:Logit回归模型
  逻辑回归模型(Logit回归模型)是被广泛应用的机器学习算法,在训练和预测方面展现出高效性能,算法相对容易实现。目前,国际上应用比较成熟、稳定、可解释性好的方法是广义线性模型(Generalized Linear Model)中的逻辑回归模型。广义线性模型基本公式为:
  (二)逻辑回归算法对信用风险模型的适用性
  因为逻辑回归模型不要求样本服从正态分布,其假设条件尤其符合信用风险违约概率非对称分布的特征。除此以外,逻辑回归算法的模型并非给出离散的分类结果,而是给出该样本属于各个类别的概率。在信用风险度量模型的研究中,一般设定的目标变量为授信对象是否违约,是否违约这一目标变量具有二分类性质。公式(3)中,不论回归系数如何变化,目标变量Y始终在0至1之间变化,假设Y发生的概率为P,则有
  公式(4)
  公式(4)称为Logit转换。因为P的值介于0至1之间,而Logit转换后的P’的值:
  公式(5)
  经过这一项转换,P’的值介于-∞至+∞,消除了取值在0至1的限制,从而可以用传统线性回归解决,逻辑回归的过程将通过积累的信用风险样本的数据,分析自变量和因变量(是否违约的哑变量)之间的关系,通过统计学的方法,取得在一定置信区间内,通过显著性检验的自变量,然后结合对最大似然法的运用,来估算公式(5)中的参数。
  假设有违约授信对象样本为,,…,有未违约的授信对象的样本为 ,,…, 其中h≧n,建立逻辑回归模型预测不违约的概率,则该似然函数为:
  公式(6)
  公式(6)用导函数取L的对数,通过得到能使似然函数的最大化的方法,来估计公式(5)中的参数。
  逻辑回归采用了最大似然法进行参数上的测算,而逻辑回归对于完成这个测算的假设条件非常宽松,并不一定需要服从正态分布的样本数据,还适用于非线性的数据关系分析,与信用风险中作为研究对象的授信客群现实情况比较接近或吻合。现在这一算法已被广泛地应用于巴塞尔体系的信用风险模型训练上。
  一般而言,逻辑回归方法对具有中、小噪声的数据的稳健性表现较好,可以抵抗较不严重的多重共线性对模型的影响。即便在开发中还是可能会发生严重的多重共线性,也可以使用逻辑回归结合 L2 正则化方法来解决,所以多重共线性对逻辑回归方法而言完全是个可以解决的问题。
  逻辑回归法输出的结果并不是一个离散值或单一确切的类别,而是一个与每个观测样本相关的违约概率,或一个对应的概率区间。使用者能够使用不同的审核标准和常用的性能指标来分析这个概率分数和监控指标的变化,并确立一个具体阈值,然后使用最符合解决模型使用者业务问题的方式对逻辑回归的结果进行分类输出。在模型的运行方面,和线性回归类的判别方法不同的是,逻辑回归模型没有一个理论上的信用风险临界值,这个阈值可以根据模型使用者的业务需求来自由制定,在金融行业领域,对于同一个逻辑回归模型的结果,模型使用者可以通过调整根据管理需要设定的阈值,即临界值获得不同的分类输出结果。一般情况下,可以将0.5作为阈值来对授信对象进行高违约风险和低违约风险的划分。   对于主营业务为面向小微客户提供借款服务的授信机构来说,面向的客群数量较大,授信额度较低,授信业务处理上有较高时效性的要求,运用逻辑回归方法建立的信用风险度量模型适用程度非常高。随着客户样本数据不断累积和更新,模型可以不断地通过累计样本数据进行及时的调试和升级,又能令业务较为稳健地不间断地实施。
  (三)文献回顾
  1977年,Martin运用逻辑回归的方法,采用了50多家破产银行的8个财务比例数据为样本,建立了一个逻辑回归度量模型,并且将该模型的结果与多元线性回归建立的模型结果做了对比,比较之下得到逻辑回归模型的在预测效果上更占优势(Gordy,2000)。1980年,Ohlson运用了9个企业财务指标建立出一个正确率超过80%的逻辑回归度量模型。此次研究中,他提取了从1970年到1976年中超过100家的破产企业,以及超过2000家正常运营的公司,作为建模样本(Ohlson,1980)。1998年,王春峰等分别运用多元回归分析方法和逻辑回归的分析方法,对选取出的一批样本进行了模型度量的研究,经过对比分析得到了样本数据量的大小对度量模型的开发与应用有一定影响之外,也体现了对于相当大数量的樣本进行分析,逻辑回归模型能达到的预测精度较多元回归判别模型为优(王春峰、万海晖、张维,1998)。2003年,Engelmann通过一项实证研究,分别比较了Z计分模型和逻辑回归模型的研究结果。该项实证研究的成果显示,逻辑模型的预测结果比较Z计分模型而言更符合现实情况(Engelmann,Hayden,Tasche,2003)。2010年中旬,在穆迪公司针对非上市公司,运用逻辑回归等方式建立了RiskCalc的模型之后,又推出了RiskCalc Plus模型。这是一款专门面向类似中国和俄罗斯的新兴市场的评估模型,用于度量中国等新兴市场中非上市公司的信用风险。RiskCalc Plus模型得到了较为广泛的运用,而这恰恰在侧面说明了在非上市公司领域尤其是中小企业违约风险预测或财务困境预测方面,逻辑回归的模型度量方法的有效性(Moody’s Analytics,2013)。 2015年,张亮等在针对不同数据挖掘方法造成的结果不同存在的不一致风险的研究中,引入信息融合技术,通过逻辑回归模型和SVM融合的方式建立模型,选取国内制造类的上市公司为研究对象,提高了对于公司财务预警的准确率(张亮、张玲玲、陈懿冰、腾伟丽,2015)。
  在信用风险度量这一领域方面,近年来有较为丰富的研究成果,一些也在传统信用风险度量方法上做了不同程度的升级与优化。然而,这些先进模型多数着眼于较大型的以银行为代表的金融机构或者上市公司,对于以面向小微企业经营者提供授信类金融服务为主的行业,在信用风险度量方法上的适用性的研究相对较少,而站在典当行业立场上研究实施信用风险度量方面的研究更为稀缺。本文的研究希望能够丰富这方面的内容,为相对专业人才和能力更为欠缺的典当公司的信用风险度量和监控提供借鉴和帮助。
  三、典当行业的现状及其信用风险管理需求
  (一)典当行业的现状
  典当是一个在中国存在悠久历史的行业,典当过程是自然人通过向当铺抵押所持有的物品来换取一定数量的现金,现金的金额一般会低于物品本身价值,以此来解决自身对于现金的较为急迫的需求。典当行业发展演变到了近现代后,被更多的视为一种融资的方式拥有了新的内涵。
  我国《典当管理办法》(2005)将典当界定为当户出于融资或者其他目的,通过将属于自己的动产或不动产类的财产权利作为当物,抵押给典当公司,而为获得典当公司支付的当金,当户被要求先支付一定比例的费用,并且按照与典当公司的约定在一个约定的期限内偿还当金、支付当金利息,从而赎回抵押给典当公司的当物的行为。从典当交易的本质上来看,典当其实就是一种以物换钱的融资方法,并且只要当户按典当时的约定,在规定的时间期限内还清本金并且支付相当的利息和其他相关费用,就可以赎回当物,重新拥有当物的财产权利。而通过典当的这种方式,能够使当户在短期内融资到相当于当物价值的资金,以作急需之用。
  (二)典当行业的信用风险度量需求
  2005 年《典当管理办法》出台以来,我国典当行业的内部管理与外部监管在整体上从无序走向了有序发展,典当业务逐渐升温。典当行业在经济领域发挥着拓宽企业融资渠道、抑制高利贷地下钱庄、维护经济安定等较为重要的作用。
  2017 年,整个行业的典当余额仅仅占到社会融资规模存量的 0.01%,与上年相比基本持平,虽然总体上仍处于盈利的情况,但营业收入有所下降。2017年全行业实现营业收入 91.2 亿元,同比降低 5.1%。其中,主营业务收入(典当的利息及综合服务费收入)79.6 亿元,同比降低 8.2%。行业亏损面与亏损额较上年有所上升。其中出现亏损(营业利润为负)的企业有 3100 家,亏损面 36.5%,较上年上升 6.8个百分点;所有亏损企业的累计亏损额共 10.4 亿元,同比上升 4%。2017 年典当行业贷款逾期率上升,绝当率较上年持平。2017 年行业逾期贷款余额 127.7 亿元,贷款逾期率为 13.3%,较上年上升 0.5 个百分点。但是对比小额贷款公司的行业情况,截至 2017 年 12 月底,典当余额 963.7 亿元,不到小额贷款公司贷款余额 9799 亿元的十分之一,而典当余额 0.7%的增长比率对比 2017 年上半年小额贷款类产品的发行数量环比增长的 63.89%间的差距,是十分巨大的。
  当前在小额借贷这一行业领域内,拥有更悠久历史的典当行业处于远远落后的位置,面临着极其严峻的竞争态势。众多典当公司为拓展甚至只是守住自己原有的市场份额,纷纷开始推出更高额、息费率更低的贷款产品,给出的借款额度非常逼近甚至超过了抵押、质押典当物的市场价格。这意味着典当公司将承受更高的违约风险和违约资产损失率,对信用风险施行有效度量和监控的需求更加迫切。   四、A典当公司信用风险度量方法的选择
  (一)案例公司的业务特点
  A 公司主营业务含房产抵押、车产抵押,以及黄金为主的民品类抵押业务,从其资金规模、典当余额和员工规模上来说,是一家较为典型的中型典当公司。其房地产抵押、机动车抵押典当服务,主要面向中小微企业、个体经营类客户,民品抵押主要面向个人客户。
  根据 A 公司近两年的当金余额统计,机动车抵押类为其最主要的营业收入来源,机动车抵押类当金余额占到年总余额的近八成。房地产抵押类的当金余额则占比不到两成,民品的当金余额占总当金余额的比例不到半成。
  A公司提供房地产抵押服务的抵押期限最长为12个月,提供出借的当金金额在通常情况下,一笔控制在不超过300万元。A公司的民品业务目前仅接受黄金饰品和名表的抵押,单笔当金金额在0.5万元到1万元之间。
  A公司的机动车抵押类业务又可以划分为两类,一类是仅办理质押手续不做押车,另一类是押车,机动车抵、质押类业务提供的出借当金金额大多数取决于借款人抵、质押的机动车价值大小,一般情况不超过50万元。不押车服务的抵押期限最长可达36个月,在对车辆办理质押手续后,客户能够开走车辆,继续使用;而押车类服务则要求客户将车存放在典当公司的车库内作为担保品,一般此类的抵押期限会在24个月,此外押车类客户可以享受到以10万元价值的车抵获得最高20万元当金借款的融资。
  A公司2016年至2017年的业务受大环境影响,经历了互联网金融的竞争冲击,尤其机动车抵、质押的新当客户每月增加数字非常缓慢。为吸引新客户,A公司从原来仅提供押品价值八成以内的借款额度,陆续上调至极贴近甚至超过质押机动车价值近一倍的额度,而且受到同业市场竞争的影响,A公司所收的月息费率较以往调降了0.5%~1%。与此同时,为了在服务质量上更好地吸引客户,不断精简和压缩线下信用风险审核人员的审核时效,A公司对于押车服务承诺在半小时以内闪电办理并放款,而车辆质押类不押车的业务则承诺在四小时以内完成审核和放款的流程。为此,A公司近两年在信用风险的管理人员投入上,有了较大幅度的增加。
  (二)案例公司面临的信用风险分析
  A公司的信用风险主要体现在债务人即当户在期限届满,无法履约偿还或逾期偿还当金本息,令典当公司收益受损的情况。A公司信用风险的根源在于债务人还款能力出现了问题。由于其客群主体是小微企业经营者,当金本息的偿还一般通过其取得的经营收入,或者通过一些其他途径融入新的资金来实现,最主要的是通过作为第一还款来源的客户的企业经营收入所得进行偿还,所以一旦经营情况出现了问题,便会丧失还款能力;当然还不排除有些客户即便具有还款能力却没有偿付债务的意愿,甚至在一开始就是抱持着欺诈的目的去骗取当金的事件。不管哪种情况下,A公司每增加一笔典当业务的盈利性资产,就必须多承担一笔当户可能发生违约的风险。
  例如,在机动车抵、质押业务方面,A公司提供的当金金额(相当于授信额度)绝大多数取决于借款人提供的抵押/质押车辆的价值大小,但为吸引新客户,现已上调至极贴近甚至超过抵/质押机动车价值一倍的额度,与此同时不同程度地降低了息费率。这无疑已经打破了传统典当“以物换钱”——以抵/质押物品的价值保证覆盖信用风险损失的核心内容,一旦违约发生,将直接面临超过的抵/质押物品价值那部分的当金本息损失。
  而对于抵/质押物品覆蓋的一部分,也依然会有为此额外付出风险管理的人力、物力上面的劳动损耗和成本支出的情况。
  A公司押车类业务,在客户违约发生时,根据《典当管理办法》规定,典当行对绝当物品自行处理的限额是在3万元以下,而机动车的价值多数超过这个数字,显然不得不通过诉讼途径处理绝当车辆,以增加维权上面的人力和财务投入。而所押车辆的价值,也会存在一定幅度的贬值风险,在违约发生时获得的处理价值可能难以保证本息的足额抵偿。
  A公司不押车类业务,尽管为了掌握质押车辆的去向在车上安装了GPS跟踪,但遇到没有还款意愿类的违约客户,普遍会发生客户恶意拆除GPS后逃债,使得A公司无法在短时间内追回甚至一直无法追回质押车辆,蒙受该部分的全额损失。
  A公司的房产业务,违约发生后尽管不动产的抵押手续完全,但通过法律诉讼的处理程序处置起来所耗费的时间非常长,尤其在违约客户不配合的情况下,处置周期甚至可以达两年之久,再加上一套房产的抵押加总起来可以达到上千万元,这种情况下该类违约的发生极大增加了A公司资本的机会成本。
  (三)A公司信用风险度量模型方法的选择
  A公司内部建立了贷前审核团队和催收团队来实施信用风险的管控,但在贷款发放之后,至逾期发生催收介入之前,目前并没有有效的手段去度量、监控放款至还款期限届满这一相当长的期间客户信用风险状况的变化,从而也无法通过催收团队及时有效地控制信用风险上的损失。A公司对这部分信用风险的度量和监控有相当迫切的需求,本文的信用风险度量模型研究正是基于A公司的这一需求展开的。
  常用的信用风险度量方法除逻辑回归模型外,还有Credit Metrics模型、Credit Risk+模型、KMV模型、Z计分模型方法和5C分析法。考虑到自己以小微企业为主要授信客群的业务特点,结合不同信用风险度量方法模型原理、优势与缺陷、适用场景的比较分析,A公司最后决定采用逻辑回归模型方法度量信用风险。
  首先,逻辑回归模型方法的原理假设并不要求样本的变量数据分布服从正态分布,也没有像其他金融理论模型方法的诸多严格假定条件,贴合 A 公司累积样本的数据分布情况,构建度量模型会比较合适。模型原理并无对股票数据或财务数据的要求,非常适合以中小微企业客群为服务对象的 A 公司的境况,且在进一步累积这些客户样本数据后,能够进一步对度量模型的精确度进行优化和升级;逻辑回归模型构建过程中选出的变量,也能够被应用于 A 公司的管理和监控策略上。除此之外,逻辑回归模型可以根据 A 公司现有的人力资源和未来的人力投入上的安排,设定和调整进入人工复核工作队列的阈值。   其次,Credit Metrics模型、Credit Risk+模型、KMV模型这三种金融理论计量模型,以及Z计分模型方法的理论基础都存在着较为严格的假设条件。这些和从事典当行业的A公司的业务特点和主要授信客群的数据样本情况差距较大,且这些模型方法都需要建立在真实准确的财务数据,以及股、债市场数据的一定规模的历史累积的情况下。A公司服务的客群主要对象却是缺少财务数据信息且规模较小的非上市公司,无法达成这些模型开发的理论假设前提和数据准备要求。从适用性上来说,Credit Metrics模型更适用于有充足金融市场数据可以获取的,持有信贷资产组合的金融机构的信用风险度量;Credit Risk+模型更适合对授信客户群的累积样本数量大,主要授信客户具有组合债券市场债券信用风险特征的机构;KMV模型则显然更适合以发达资本市场内的上市公司为主要授信客户群,并具有能力去累积充分金融数据的金融机构;Z计分模型则需要金融机构具有充足的真实财务数据样本,授信客户群在未来也具备财务信息真实的特点。显然,以上种种都和A公司的授信客户群实际情况差异较大。哪怕是未来,A公司的授信客户群样本也一样缺少这样的数据信息。5C分析法可以作为过渡方案在业务初期,在客群样本未累积到一定规模的情况下使用,或授信额度较高,日常受理的申请客户群数目小,没有高审批时效需求为主要业务的授信机构,但这显然无法满足现阶段A公司的要求。
  还有一些方法也可在建模过程中结合对样本的变量数据分布是否服从正态分布这方面不做要求的运算方法,如随机森林和人工神经网络方法,但因为这两种方法的信用风险判定结果无法提供一个有效推理和对产生过程逻辑上的解释。这对管理操作上较为精简的从事典当行业的A公司来说,选择这类方法开发或训练模型,很难利用模型开发或训练的结果找到目前实施的授信规则和策略问题或未来调整方向,也就不可能对目前已颁布的授信操作规则和政策以及已实施的风险变量监控策略在保持一定的连贯性程度上,有效地进行改进调整,或令审核人员及相关业务人员在业务操作上做出改变。除此以外,出于对模型预测和训练效率的考虑,A公司也未考虑采用随机森林模型或人工神经网络模型作为选项。
  五、A典当公司信用风险度量模型的确立
  (一)模型所用客群样本的选取标准
  A公司信用风险度量模型将首先对A公司借款客群的信用历史记录进行整合、分析和提炼,在此基础上对授信业务活动数据进行更深层次的挖掘,将A公司记录的样本数据进一步参数化,反映A公司借款客群中,区别于正常客户的高信用风险的特征,结合信贷逾期表现,提炼出违约客户的规律,最后通过量化的方式得出违约概率,作为贷款发放后信用风险管理决策的科学依据。
  A公司积累的客户样本参数为借贷关系成立后的客户基本信息和还款行为的表现。结合A公司的信用风险管理情况,希望借助本信用风险度量模型,识别A公司存续业务中当户客群信用风险变化,识别与区分低信用风险客群和高信用风险客群。当客户发生还款逾期的概率突破设定的临界值时,模型能通过量化的方式实现信用风险预警,使A公司能够更及时地部署催收人力的投入,挽回损失。
  结合A公司当前实施的信用风险管理策略,模型所用样本范围为A公司保存较完善的2015年1月1日至2017年5月31日期间,曾通过机动车抵、质押获得当金借款的客户样本数据。具体选择标准包括:(1)还款发生累积逾期天数大于等于15天,或者被起诉,或者丧失能够处置的抵、质押资产的客户样本作为高信用风险客户样本,即作为本次模型研究的目标客户;(2) 已经赎当未发生逾期,或已经赎当且最高累积逾期天数小于15天的客户样本作为低信用风险客户样本,也就是本次模型研究的其他客户。
  确定以此标准来挑选样本的原因为:(1)A公司的主要业务面向小微企业业主开展,授信客户也就是当户,主要通过抵押、质押机动车的形式获得A公司的当金借款,一旦客户逾期未能偿付拖欠的利息费用、本金,A公司将遭受违约风险造成的损失可能。由于A公司以相当于甚至高于质押车产价值的金额授信,这将超过处置质押资产的所得。(2)选取逾期超过15天的原因则是基于A公司现有内部实施的催收策略的考量。在逾期发生时,A公司的催收团队会通过通信的手段提醒客户履约,而在累积满15天客户未履行偿付利息费用、本金的情况下,A公司会投入较高的成本去掌控质押机动车的具体位置,并启动处置资产的法律程序。
  按此标准,在A公司存储相对有限的数据库中,抽取获得的有效客户样本总数量为1493位客户,其中含有高信用风险的目标客户471位。本文采用10折交叉验证法来保障对模型的验证效果,即在1493位客户样本中再随机抽取出90%将作为建模数据,10%将作为验证数据对模型进行一定程度的检验。
  (二)备选模型指标
  通过A公司在多年的信用风险管理的探索和实践中,专业审核人员在人工审核中所积累的经验,并通过数据清洗后对高缺失率、空值和零值率、高重复值率和异常数据的筛选,最终选取了以下22个指标设立模型(见表1),并确定了指标计量方法(见表2)。
  (三)描述性统计
  用于构建模型的这些备选指标涵盖了授信对象经营主体的法人信息、资产信息、历史借款信息、资产抵、质押比例信息、通过续当展期的信息、逾期记录和历史还款信息。这22个假设指标的积累是经过A公司风控专业审核人员经验评估之下,从最基础、最细粒度数据信息,进行对以授信对象为主键的汇总后整理所得的。此外,在监控授信对象的信用风险变化过程中,又对这些量化的指标在不同的时间窗口下进行均值、极值的测算,进行相对值的比较后确立下的标准,并在A公司对信用风险的管理实施过程中,对这些数据加以記录和保存的成果。
  经过对以上累积指标信息的提取,进而在对这些指标进行数据清洗和整理的过程后,通过使用决策树的方法对这22个连续型变量指标进行了数据分箱的处理加工,最终获得不同分段的124个哑变量指标,作为接下来将开展的逻辑回归模型建模的备选变量。当A公司客户样本的变量数据落在对应的22个指标中的某一段时,其对应的哑变量分段为1,其余为0,这些备选指标各分段哑变量的描述性统计见表3。   (四)模型参数的确立
  本次建模随机抽取了1493个客户样本,其中含有471个目标客户样本(简称为目标样本),目标样本为样本总数的32%。通过运用SAS软件,对表3的备选指标进行逻辑回归分析,运用后向剔除(BACKWARD)的方式挑选变量,最终在90%的置信区间内,获得满足显著性水平条件的18个哑变量(见表4)。
  从表3的描述性统计结果和表4的结果来看,在90%的置信区间内,满足显著性水平条件的共18个分段哑变量,而通过逻辑回归最终选出的这18个分段哑变量在区分目标的关系上与预期保持了一致性。
  法人年龄指标的3分段和5分段,描述性统计结果中目标占比显示为22%与25%,都低于总分布中的目标占比32%,显示为负相关关系;逾期累積天数1分段描述性统计目标占比15%,低于总分布中的目标占比,显示为负相关关系;当金增长率2分段描述性统计目标占比为9%,显示为负相关关系;上笔还款金额1分段描述性统计目标占比为41%,高于总分布中的目标占比32%,显示出正相关关系;押品金额4分段描述性统计目标占比21%,低于总分布中的目标占比,显示为负相关关系;借款历史3分段描述性统计目标占比为45%,高于总分布中的目标占比,显示出正相关关系;历史累积当金总额6分段描述性统计目标占比27%,低于总分布中的目标占比,显示为负相关关系;历史累积展期天数4分段和5分段描述性统计结果中目标占比显示各自为36%与47%,都高于总分布中的目标占比,显示出正相关关系;最近逾期天数2分段和3分段描述性统计结果分别为11%和17%,分别低于总分布中的目标占比,显示出负相关关系;最长逾期天数3分段和4分段描述性统计结果分别为12%和30%,各低于总分布中的目标占比,显示出负相关关系;最高折当率4分段描述性统计结果为45%,高于总分布中的目标占比,显示出正相关关系;最高当金金额6分段描述性统计结果为37%,高于总分布中的目标占比,显示出正相关关系;平均当金增长率1分段描述性统计结果为15%,低于总分布中的目标占比,显示出负相关关系;平均逾期频次2分段描述性统计结果为9%,低于总分布中的目标占比,显示出负相关关系。
  对以上参数进行对多重共线性的排查检验,测算出的VIF(variance inflation factors)值中最高的为上笔还款金额1分段的1.51,都小于2。据此,A公司最终确立信用风险度量的逻辑回归函数公式,参照前文公式(5),得到结果公式(7):
  
  (五)模型验证结果
  本次验证采用10折交叉验证的方法,对以上逻辑回归方法得到的信用风险度量模型的验证。
  10折交叉验证(10-fold cross-validation)是一种常用的测试方法,用于检测模型算法的准确性。操作中会将样本数据集随机分成十等份,通过轮流地取其中的9份作为模型的训练数据集,剩下的1份作为测试数据集的方式对模型进行检验,然后将10次的结果取平均值作为对模型算法的精度的评估结果。
  本组模型的10折交叉验证的验证结果见表5。
  ROC(Receiver Operating Characteristic Curve)值一般在0.5~1.0之间,ROC曲线描述了在一定好客户累计比例下坏客户的累计占比,ROC值越大表示模型判断准确性越高,即越接近1越好,ROC值越高代表模型的分别能力越强。本组模型经过10折交叉验证所得ROC值的均值较高,显示本组模型的模型效果分别能力较好。
  KS(Kolmogorov-Smirnov)值主要是验证模型对违约对象的区分能力的评价。实践中通常是在模型预测全体的信用风险模型训练客户样本的度量结果后,将全体样本按违约客户与非违约客户分为两部分,然后用KS统计量来检验信用风险度量模型对这两组客户样本的分布是否有显著差异(郑王芳,2013)。本组模型经过10折交叉验证所得KS值的均值为0.54,表示本组模型的预测准确性较为理想。
  六、模型在A公司的应用
  A公司运用该信用风险度量模型的公式(7)计算全体1493个样本的概率分布见表6。
  结合表7的目标样本概率分布,若将50%的概率作为阈值,共取出417个样本,其中包含291个目标样本,占目标样本总数的61.78%;417个抓取样本中目标样本的占比近70%。若将75%的概率作为阈值,则会取出154个样本,包含117个目标样本,目标样本的占比则会接近75%。
  考虑到A公司有限的风险管理人力资源,在初期阶段的模型应用中以75%的概率作为阈值,继续运用该信用风险度量模型的公式(7)对A公司2017年11月一整个月期间存续的客户进行高信用风险概率的度量,对抽取出的近4000名客户进行测算,得到79名高风险客户名单。经过A公司催收团队的初步判断,其中需要立即采取行动的客户为30家,剩余客户需要进一步密切观察。
  七、结论与局限性
  (一)研究结论
  本文以典当公司信用风险度量模型为研究对象:首先对典当公司的业务特征和面临的信用风险进行分析;其次结合典当公司授信主体与管理需求的特征,分析了不同信用风险度量模型的适用性;再次以较为典型的A典当公司授信客群为样本,采用了逻辑回归模型的方法来构建适合典当公司使用的信用风险度量模型。
  在本次的信用风险度量模型的建立过程中,一共随机抽取了A公司1493位客户作为建模的样本,运用了逻辑回归方法构建了一个信用风险度量模型,并经过10折交叉验证法的检验,验证该模型有较理想的预测精确度,通过收集A公司的催收团队实际运用该模型度量结果的评价,初步得出该组模型具有一定的预测能力,为典当公司在未来进一步开展信用风险度量模型方面的实践打下了基础。
  (二)研究局限性
  本案例研究过程中所获取的样本未覆盖一个完整的经济周期,且由于A公司数据存储方面的一些原因,构建模型所能获取并运用的样本数据量级相对偏小,不可避免地会对逻辑回归模型在实践运用中的精确性和稳定性造成一定影响。本文所构建的逻辑回归模型采用的22个指标主要基于A公司审核人员的从业经验选出,并不一定能代表典当行业对信用风险度量的最佳选择,使得逻辑回归方法对模型挑选变量的过程具有一定的主观性,意味着即使模型验证下来效果理想也并不一定是最优结果。
  在典当公司未来信用风险度量模型研究中,应考虑通过积累更多参数、更大量级、更长时间窗口的有效样本数据来训练逻辑回归模型,提升模型预测的精确度和稳健性。在积累更多种、更大量级样本参数和完整经济周期的有效样本数据之后,可考虑将逻辑回归方法与其他大数据分析模型方法(比如随机森林)相结合的方式,提升信用风险度量效果。
  责任编辑   屈涛
其他文献
20世纪70年代末,我国开始对管理会计进行研究和应用,历经40多年发展,在管理会计应用方面取得了明显成效,但整体应用水平还不理想。同时,管理会计理论对实践的指导作用也未得到充分发挥。  2014年,伴随着《财政部關于全面推进管理会计体系建设的指导意见》(以下简称《指导意见》)的发布,我国开启了管理会计加速发展的新篇章。在《指导意见》这一纲领性文件中,财政部为我国管理会计的大发展规划了蓝图,即建立与
期刊
【摘要】 2020年6月,国资委发布《关于开展对标世界一流管理提升行动的通知》,要求国有企业通过开展对标管理提升自身管理水平。结合通知提出的总体要求和重点任务,本文从战略管理、预算管理、风险管理、业绩与薪酬管理这一闭环管理系统的四个方面,分别阐述国有企业如何借助平衡计分卡、战略地图、全面预算管理、风险清单、关键绩效指标、经济增加值等管理会计工具,通过引入具有差异化的弹性标杆、生成“标杆报告”、持续
期刊
【摘要】 经典论著《管理会计兴衰史:相关性的遗失》中提出:在近100多年来,随着资本市场的发展,基础核算和对外披露不断丰富和完善,而管理会计信息与战略落地、价值创造、管理决策的相关性却日渐淡薄,这个现象被总结为“相关性的遗失”。在当前的中国,我们发现,相关性遗失的问题仍然是制约中国企业管理能力提升的关键因素。而管理会计体系建设应该是解决这一问题的一把最重要的“钥匙”。  关键词 :相关性遗失 重建
期刊
在此次新冠疫情危机应对和复工复产的大背景下,各行各业财务系统和财会团队临危受命,创新工作思路和变革管理模式,在企业防控风险与复工复产等方面发挥了功不可没的作用。《管理会计研究》作为一本立足理论探索、实操创新的专业期刊,因时顺势,特别策划“疫情中中国企业财务部的特别行动”笔谈文章。本次征稿基于企业在具体议题、行业、地域、企业产权性质、经营规模等方面多样性的原则进行话题设置,以求尽可能全方位地呈现疫情
期刊
【摘要】本文在对管理会计价值创造分析的基础上,通过运用相关管理会计工具方法,将价值管理循环与企业生产经营管理过程相结合,将抽象的价值创造落实到具体的活动载体,构建了铁路运输企业管理会计价值创造活动的运行路径,对同类型企业管理会计的深入应用具有较大的参考和借鉴意义。  一、引言  铁路运输是国家综合运输体系的重要组成部分,是国民经济重要的支柱产业。铁路运输企业作为国家大型国有企业,肩负着社会民生基础
期刊
【摘要】中石化西北油田对传统成本管理思路和体系进行改造,结合企业经营特点,提出以SEC储量为核心,构建储量、产量、投资、成本、效益“五位一体”的量化决策模型。本文介绍了该成本管理创新的背景、逻辑和整体思路,以及具体子模型的构建和实施路径。  一、问题的提出  随着市场环境的变化、认知水平的提高、经营理念的转变,企业成本管理需要不断创新,以适应企业发展的需要。无论是成本管理的范围,还是成本管理的工具
期刊
【摘要】航空制造企业的产品普遍具有多品种、小批量、作业高度交叉等特点,每个项目从立项、研发设计到生产制造和销售服务等环节的成功运行需要一套科学高效的管理体系指导,才能得到客户对产品品质、服务价值的认同,从而引导消费需求,为企业创造发展机会。本文以江西洪都航空工业集团有限责任公司(以下简称航空工业洪都)为例,公司通过建立以客户价值和企业战略为导向的全生命周期项目价值管理模型,将技术与经济深度融合,围
期刊
【摘要】本文针对当前房地产企业面对的限价、销售期不断延长和融资渠道受限且融资成本上升的新情况,以内含报酬率分析方法为手段,研究了销售周期和资本结构对内含报酬率的影响,并结合JX房地产公司的實际项目进行分析,研究发现当考虑货币的时间价值后,销售周期加长会导致内含报酬率下降,地产企业资本结构中的债务融资越多,前述的下降速度越快。地产企业若无法实现对建筑工程款的无息占用,项目一旦不能迅速完成销售,则很容
期刊
【摘要】 战略与预算管理脱节,是企业全面预算管理实践中困扰诸多企业的一个难题。时代中国通过构建相应的测算模型,通过战略模拟和推演,将战略量化到年度经营计划,并将此作为年度预算目标参与滚动测算,形成了战略与预算上下貫通的预算管理体系,避免了在企业中所常见的战略与预算脱节的问题。  关键词:经营计划 战略测算 滚动测算 预算脱节  一、引言  如何解决战略与预算脱节问题,是企业预算管理活动中需要面对的
期刊
【摘要】 对企业来说,确定成本耗费标准一直是企业预算编制的重点和难点。为了更科学确定企业的定额标准,S集团将成本预算的编制建立在影响产品成本的各项作业基础上,构建了标准的成本定额体系,通过作业梳理、作业环节划小和确定成本消耗动因等,各单位的费用计算基础、标准由此得到了统一,有效提高了成本控制的科学性和有效性,对集团低成本战略形成了有力支撑。  关键词:作业成本法 定额数据 成本动因 定额模型  一
期刊