网贷用户违约风险的影响因素研究 ——基于集成树模型

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:hailianghoyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络借贷是一种新型的借贷形式,是我国互联网金融的重要组成部分。从2007年中国出现了第一家互联网借贷平台后,网络借贷在我国得到了飞速发展,同时也面临着诸多挑战,不少网贷平台由于风控能力的欠缺,大量用户发生违约行为导致平台关闭。很多学者和相关专家尝试将机器学习算法与网贷相结合,预测用户是否会发生违约行为,然而在实际业务场景下,仅仅能判断用户是否会违约对于平台来说还不够,平台需要了解影响用户违约的因素来调整运营策略。由于复杂机器学习算法并不具有较强的可解释性,不像传统线性模型一样有回归系数等参数,很难通过模型探索用户违约风险的影响因素,因此许多网贷平台仍然使用传统风控方法或者较简单的违约风险模型。本文使用Python爬虫技术爬取真实的网络借贷数据做实证分析,构建能准确判断用户是否会发生违约行为的集成树模型并基于模型研究违约风险的影响因素,尝试化解机器学习模型预测准确性和可解释性的矛盾。首先对数据集做数据处理,处理了数据缺失、异常等问题,用SMOTE算法解决了数据的不平衡。特征工程方面,用人工处理的方式清洗特征,并用嵌入法的方式对特征做出选择。将处理好的数据集做简单的描述性统计分析,从数据分布的角度探索违约风险的影响因素,发现传统研究方法的不足。随后建立基于Logistic回归、随机森林和Xgboost算法的用户违约风险模型,从精度和召回率的角度对模型作出对比评价,选择出最优秀的违约风险模型。最后分别用Logistic回归系数、集成树特征重要度和SHAP值的方法研究用户违约风险的影响因素。对比分析三种模型解释方式的特点和局限性,详细展开Xgboost-shap值的方法,分别从单个样本、模型整体和对比变量角度分析影响因素,可以此分析重点用户、平台整体的违约风险影响因素,并突破性地分析多个特征交互作用对用户违约风险造成的影响。本文的实证分析表明,使用嵌入法处理特征及SMOTE算法处理数据不平衡后能够提升违约风险模型的表现效果,集成树模型的预测效果优于简单机器学习模型Logistic回归,虽然Logistic回归有较高的违约用户召回率,但是精度过于低,不能将其投入真实业务场景中。在研究用户违约风险的影响因素方面,传统的描述性统计和模型自身参数都各自存在其局限性。使用Xgboost-SHAP值方法,能够从多个维度分析违约风险的影响因素,并且集成树模型Xgboost也保证了结果的可靠性。在未来,网贷平台风控工作者可以合理地将复杂的集成模型与SHAP值相结合,在保证预测准确率的情况下正确的找到违约风险的影响因素,帮助运营及时调整运营策略,减少用户违约损失,同时在细化到具体用户、具体因素时,该方法也提供了很好的解决问题的方案。复杂机器学习模型与SHAP值方法的结合,也为工业、教育、医疗等其他领域提供解决问题的新思路。
其他文献
随着我国电子商务产业的飞速发展,越来越多的消费者选择网购平台进行购物。2018年我国网上零售额9.01万亿元,同比增长23.9%。不断增长的网上零售额给网购平台带来了巨大的经济效益,新的电商企业不断加入其中,网购平台之间的竞争日趋激烈。而用户是网购平台发展壮大的核心竞争力,只有了解消费者选择网购平台的影响因素,找出消费者关注的重点,网购平台才能有效地进行改进,将有限的资源投入到关键因素上,获得更多
苦参碱是从豆科植物苦参中提取的一种单体生物碱,其具有广泛的药理活性如抗肿瘤、抗炎、抗病毒、抑菌、杀虫等作用。在农业应用方面,苦参碱是一种应用广泛的天然植物农药。它具有特定性、天然性的特点,不会污染环境、对农产品无害以及对人牲安全,它主要作用于控制害虫生物种群数量不对该植物种群的生产和繁衍产生严重影响,而不是直接完全毒杀相应害虫。这说明苦参碱不同于一般高毒、高残留的化学农药,是十分绿色、环保的。但苦
股票市场的波动性一直是被关注的焦点,波动意味着收益和风险,平衡好收益与风险是投资过程中的难题。股票价格的适度波动是市场有序发展的基础,因此股市波动的影响因素成为学术界研究的热点。行为金融学理论提出投资者通过影响投资行为对交易市场产生影响。2018年金融不确定性的指标度量方法引入国内研究市场,并首次提出它对股市波动具有较强的预测效果。本文分别研究了金融不确定性和投资者情绪对股市波动的影响,包括影响的
学位
许多西方学者将媒体的舆论监督权视为是独立于传统三权的“第四权力”,其主要功能在于监督公权力运行,维护社会公共利益。美国被视为是践行新闻自由制度的先行者,其保障媒体舆论监督权的举措被许多国家参照借鉴。然而,殊不知,早期美国政府也曾有过利用“诽谤罪”钳制媒体进行公共讨论的不光彩历史。当时美国诽谤法主要是沿袭英国的诽谤法传统,在媒体诽谤诉讼中适用“严格责任”准则。媒体发表任何批评政府及其公共官员或者损害
学位
在研究天然橡胶期现货市场时,存在着与人们的期望或常识现象相矛盾的数据现象,这些异常数据称为异常波动。引起异常波动的原因有很多,如宏观政策变动、突然事件发生等。异常波动的频繁发生将会影响金融市场的秩序,市场的资源配置功能得不到很好的发挥,所以对于异常数据的挖掘以及橡胶期现货市场异常波动溢出效应的研究,将为橡胶期现货市场的参与者、政策制定者和管理人员提供相关建议。本文第二章首先利用合约加权法,即以持仓
异噁唑啉衍生物和肟醚类衍生物因具有优良的生物活性在有机合成领域中发展较快。异噁唑啉衍生物具有独特的杂环结构,在农药、医药以及材料等行业广泛应用;同时,肟醚衍生物也是一类重要的具有杀虫、杀菌、抗病毒等多种生物活性的化合物,在农药化学品的研发中具有不可或缺的应用价值。本文首先以ω-甲酰基莰烯(通称为莰烯醛)为原料,与盐酸羟胺、三水合乙酸钠经亲核加成反应合成2-(3,3-二甲基双环[2.2.1]庚-2-
学位
普惠金融的价值理念是改变倒金字塔式金融服务结构,实现社会和商业双重效益。然而在传统金融模式和技术条件下,普惠金融发展面临着边际成本高、风险管理难等现实困境。随着信息技术的快速发展,普惠金融加速向数字化转型。数字普惠金融通过终端设备提供场景金融服务,突破地域限制,可以有效解决普惠金融的落地难题。一直以来,我国将发展普惠金融作为金融扶贫的重点。在脱贫攻坚的关键时刻,探究数字普惠金融对贫困减缓的影响,对