基于随机森林模型的P2P借款人信用评估研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haohailinbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络借贷进入中国已有10余年的时间,目前已成为个人以及中小微企业进行融资的重要渠道。2016年全年,我国网络借贷平台的累计数量已达5877家,而正常运营的平台数量却只有2448家,平台成交量却达到了20638.72亿元,行业总体贷款余额更是高达8162.24亿元。虽然正常运营赢得平台有所减少,但是相较2015年去年的成交量与贷款余额分别增长110%和100.99%,表明P2P网络借贷还是解决融资问题的一种重要方式。近年,随着我国互联网金融整改行动的逐步深入,我国网络借贷行业的外部借贷环境逐步得到改善,但P2P网络借贷的借款人信用风险问题依然是影响网络借贷行业发展的重要因素,且国内大多数P2P网络借贷平台的信用评估方式都较为简单、评估性能也不大理想,对借款人的信用管理还有待加强。因此,本文通过随机森林模型,结合翼龙贷的数据,构建了P2P借款人信用评估模型对P2P平台中借款人存在的信用风险问题进行评估。本文在研究P2P借款人信用评估过程中,首先简要介绍了P2P网络借贷的相关概念及发展现状,其次对比介绍了随机森林、支持向量机、Logistic回归模型,确定随机森林为本文P2P借款人信用评估所采用模型;最后结合翼龙贷数据,确定P2P借款人信用评估指标体系,并利用随机森林构建了P2P网络借贷的借款人信用评估模型。在构建随机森林模型过程中,首先参照其他P2P网络借贷地相关研究初步选取了影响借款人信用风险评估19项指标;其次利用随机森林特征选取方法筛选出8项指标作为本文P2P借款人信用评估指标体系;然后利用R语言分别构建了随机森林和支持向量机,并对其分类性能进行了比较分析。实证结果表明,随机森林特征选择能有效地筛选指标,且发现在P2P网络借贷的信用评估方面,随机森林模型具有更好的分类性能。通过分析指标筛选结果与实证结果还发现,借款人在平台中的里斯借款记录及借款信息都是影响P2P网络借贷借款人信用风险的重要观测指标。
其他文献
采用完全随机区组设计,以当地生产主推品种晋谷21号为对照,研究了杂交谷子张杂谷3号、张杂谷5号、张杂谷9号、张杂谷10号和长杂2号在太谷县的粗蛋白含量及其综合性状表现。结
目的:观察比较不同麻醉方法对胆囊切除术病人血糖、胰岛素和皮质醇的影响.方法:将40例择期行胆囊切除术的病人随机分为全麻复合硬膜外腔阻滞组(Ⅰ组)和全麻组(Ⅱ组),各20例.
针对制造车间重调度触发机制问题,建立了制造车间重调度损益函数,揭示了生产车间重调度过程损失及增益的变化规律.引入云理论测度重调度损益的不确定性,使用逆向云算法计算重
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
红外线测距仅如果使用不当,维护不好及电子元件老化等,都可能造成仪器精度的降低。作者详细论述了DI-4红外线测距仪照准误差的产生、检测及消除办法,以便能在仪器最小误差区域内
目的 探讨食管癌患者术后的支持性照顾需求程度及相关因素.方法 采取便利抽样法抽取2017年11月-2018年4月食管癌术后120例住院患者进行问卷调查.调查工具包括自行设计的一般
商业化引导美术向积极的方向发展,本文从几个方面介绍了商业化对于美术的影响。
肺是所有进展期恶性肿瘤现状最常见的转移部位,据尸检报告,几乎1/3死于癌症的病人都有肺转移[1].15%~25%只有肺转移而无其它部位转移,肉瘤则更有先转移到肺的趋向.
目的预防持续静脉泵注酚妥拉明所致静脉炎的发生。方法将60例静注酚妥拉明的患者随机分成两组,观察组采用无菌纱布覆盖穿刺点后,自穿刺点以上10~15cm用50%硫酸镁湿敷;对照组采用无
在警察法学研究中,有一种警察行为本该被类型化却没有被类型化。这种行为就是即时实施的警察职权行为。该类警察行为不仅包括学界经常研究的盘查、保护性约束措施、使用武器