几种数据挖掘算法在互联网借贷个人信用评估的比较研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:hhttllzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着大数据、云计算、人工智能等互联网信息技术的迅速发展,互联网金融业务模式也以多种形态快速崛起。互联网技术与金融业务相结合,为客户提供网络支付、网络借贷以及理财等丰富多样的低门槛、低成本、简单快捷的金融服务,并呈现出强劲的发展态势。在快速发展的同时,互联网金融也存在着如信用风险、市场风险、政策风险和操作风险等多种风险,其中信用风险是互联网借贷行业所面临的最主要风险。  互联网信贷是对传统征信业务的彻底变革,其带来的产业升级将彻底解决传统征信高成本、不及时、低准确率的弊端。大数据背景下,用户互联网行为数据的采集变得轻而易举,海量、高频的用户数据本身是实时的、动态的、高维度的,其蕴含着巨大的信息价值。因此,探索和研究如何利用互联网采集到的繁杂的用户高维度数据建立起有效的个人信用评估体系,具有重大而迫切的现实意义。  本文首先对研究涉及的互联网金融个人信用评估理论及本文应用的几种数据挖掘算法进行阐述,为之后的研究奠定理论基础,然后以融360数据为例,通过数据预处理、特征构造之后分别建立了 logistic回归模型、随机森林模型、GBDT模型和XGBoost模型,最后以AUC和KS为评价指标比较各模型在个人信用评估中的效果。发现随机森林与GBDT模型效果相差不大,但都稍优于logistic模型,而XGBoost模型的效果比其他三个模型效果好。  本文的创新之处在于大胆尝试将XGBoost模型应用于个人信用评估领域,并通过比较发现 XGBoost模型评估效果确实优于传统的分类模型,而且由于算法本身是分布式并行运行其速度得到大大提升。这些优点恰好适应了当下大数据背景下高维度、数量庞大的数据特点。
其他文献
2017年3月18日,中国郑州商品期货交易所和大连商品期货交易所相继推出豆粕、白糖期权品种,标志着我国金融衍生品市场的稳定发展和不断丰富扩大,后续将会推出更多的金融衍生。随
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
期刊
2002年3月,九届全国人大五次会议上,朱镕基总理在《政府工作报告》中指出,“要推行垄断行业改革,打破行业垄断,形成适度竞争”,这番话表明了中央对推行垄断行业改革的决心。我国民
从存量和流量两个角度定义金融深化指标,利用2000-2015年我国东部地区八个省份的面板数据,分析金融深化对经济增长的影响.利用F统计量计算方法,确定使用固定效应变参数模型.
期刊
党的各级委员会任期届满,应召开党的代表大会、党员代表大会或党员大会选举产生新的一届委员会。党的各级委员会按期换届选举,是党的组织制度的基本要求,也是保障党员民主权
文章分析了中国加入WTO后国内商业银行业竞争格局的变化,认为改进绩效,提高银行的核心竞争力是国内银行直面竞争的内在要求.国内银行的电子信息化水平已经能够满足提供各种基
民本,古老的话题。孔子编《尚书》,称“民惟邦本,本固邦宁。”司马迁著《史记》,言“制国有常,利民为本。”在新世纪的钟声里,党中央新一代领导集体与时俱进,努力地从民族的
该文首先介绍了客户关系管理产生的背景、内涵和实施应用.然后结合电信运营企业特征,探讨了中国电信运营企业开展客户关系管理的必要性和现实条件.最后,结合中国网通X分公司