论文部分内容阅读
十八大以来,防控金融风险的重要性被反复强调,防风险、大力发展普惠金融等关键词也频繁出现在中国最高级别的会议和场合中。2017年7月14日,习近平总书记在第五次全国金融工作会议上着重做出了加强风险防范,严格把控金融监管的讲话,并提出要加快普惠金融体系的建设。网贷行业作为普惠金融的重要载体,同时作为金融风险高发领域,更是监管当局关注的重中之重。自2016年以来,平台风险事件频频爆发,平台跑路事件屡见不鲜;2017年,在史上最严监管年的压力下,大量不合规网贷平台纷纷下线,抑或抽资出逃,但也有一部分平台由明转暗,成为隐形风险平台继续吸引投资者进入。目前,我国网贷行业监管正处于调整期,各类监管政策正处于实验阶段,网贷行业尚不明朗,在这一阶段,投资者如何避开“雷区”,选择优质平台进行投资;平台如何优化服务,突出自身优势;监管当局如何在乱拳中找到最终的平衡点,完善网贷行业监管机制,成为当前网贷行业发展中的重要话题。由于前期网贷业的混乱发展,目前很难获得所有平台的各类交易信息和财务信息,无法使用传统方法对平台运营进行评价和预判。因此,本文另辟蹊径,结合网贷的互联网性质,将文本挖掘技术应用到网贷行业风险预测模型的构建中,利用主题模型提取主题,构建主题指标量化文本信息,以弥补网贷行业数据不透明、质量参差不齐的问题。本文结合P2P平台的信息特点,提出一种融入文本信息的P2P网贷平台“跑路”预测方法。首先,本文利用自然语言处理技术将评价文本进行预处理,利用主题模型抽取并量化用户评价文本中的相关变量,进而分析不同变量与平台“跑路”间的影响关系。结果表明,注册地在直辖市地区的平台跑路概率比注册地在其他地区的平台跑路概率低60%;平台背景对平台跑路影响显著,民营平台和无背景平台相较其他平台更易跑路;平台资本金对平台跑路有显著影响,但不能只看平台注册资本,应注重平台实缴资本,结果显示平台实缴资本小于一半注册资本的平台跑路概率比平台实缴资本大于一半注册资本的平台跑路风险高26%;平台引入银行存管、加入监管协会以及具有ICP认证都能显著降低平台跑路概率;目前平台存在拆标增加标的流通性的情况,这会导致平台资金错配,增加平台倒闭跑路风险,结果也证实了这一现象;平台投资者的风险保障模式中,除平台垫付外,其余保障模式都有助于降低平台跑路可能性,特别是保险机构保障模式,不采用保险机构保障的网贷平台比采用保险机构保障的网贷平台跑路概率高294%,可见保险机构保障模式更有利于平台发展;从用户评价中获取的用户情感变量和多数主题变量都够反映出平台的跑路风险,在积极评价中,用户可能更关心平台回报率、平台资质、平台服务和资金站岗问题,在消极评价中,用户更关心提现反馈、平台诈骗现象、平台营销和资金站岗问题。其次,本文设计了一种两阶段的变量选择方法对基本信息变量、文本信息变量进行组合筛选;最后,对比了Logit回归预测模型与机器学习类预测模型的准确率。结果表明,基于机器学习的P2P网贷平台的跑路预测模型在融入文本信息后预测效果显著提高。