论文部分内容阅读
P2P网络借贷作为新兴的一种在线借贷模式,为传统借贷市场上的“长尾”客户提供了一种新的融资途径。其可以作为传统借贷模式的一个有益补充,对实现普惠金融具有重要的积极意义。但是,P2P网络借贷作为互联网金融的一种模式,其本质仍然是金融,既是金融,则存在金融风险。金融风险的最根本来源在于市场参与者在金融活动中的信息不对称。近年来,伴随着P2P网络借贷市场的快速发展,风险事件也开始不断上演,包括大量的借款人违约和P2P网络借贷平台发生倒闭。这些风险事件给投资者造成极大损失的同时也给政府及市场监管部门带来了大量麻烦。P2P网络借贷作为一种信用借贷模式,其面临的最大风险是借款人的信用风险。尽管在传统借贷市场上有关信用风险的研究已经非常之多,但是目前关于P2P网络借贷市场上的信用风险研究还比较欠缺。与传统借贷市场不同的是,P2P网络借贷在借贷活动中产生了大量的非结构化数据。近期的一些研究表明,这些非结构化数据也能够影响P2P网络借贷活动不同阶段的表现,包括贷款融资和偿付阶段。从而,在风险模型中融入非结构化信息有助于更准确地评估参与者的信用风险。基于此,本文综合利用计量经济学模型、深度学习理论和文本分析技术,首先着重探讨了P2P网络借贷活动中不同因子在不同阶段,特别是在贷款偿付阶段的作用。接着构建了融合贷款描述文本特征的借款人信用风险评估模型。最后探究投资者社区评论情感与P2P网络借贷平台破产之间的关联性。本文的研究工作及创新点简述如下:1,基于人人贷平台的借贷交易记录,本文实证分析了在P2P网络借贷活动的不同阶段中,贷款申请的特征、项目认证、借款人的各项特征等与借贷活动各阶段结果表现之间的关系,并重点分析了软信息在其中的作用。另外,本文也在贷款申请发布阶段刻画了借款人的群体特征。清晰地刻画了P2P网络借贷市场上软信息在网络借贷活动中影响及作用。2,使用基于词典的文本特征表示方法,本文将贷款描述分解为标准信息成分和特定信息成分。其中标准信息成分反映了当前贷款描述与近期已发布贷款的贷款描述之间的共性内容。而特定信息成分反映了当前贷款描述中借款人的个人特定信息内容。基于人人贷平台的交易数据,本文研究发现借款人提供贷款描述的动机主要是炒作他们的贷款申请,而不是为了降低他们和投资者之间的信息不对称。3,基于Trasnformer-Encoder模型,本文首先从贷款描述中抽取信用风险相关的文本特征。然后将其与传统评估借款人信用风险的其他量化指标相结合,构建了融合贷款描述文本特征的借款人信用风险评估模型。并利用人人贷平台和Lending Club平台的借贷交易记录实证检验了该模型的预测性能。结果表明,从贷款描述中抽取的文本特征有助于更准确地评估借款人的信用风险,同时本文构建的信用风险评估模型表现最佳。4,基于弱监督机制的短文本情感分析技术,本文最后研究了投资者社区评论情感与网络借贷平台破产之间的关联。我们首先以弱标签形式的投资者社区评论数据训练弱监督机制下的短文本情感分类预训练模型。然后,利用人工标注良好的投资者社区评论数据对上述预训练模型进行微调。最后,利用微调后的模型对投资者社区的每一条评论进行情感评分。并针对每个平台构建一段时期内的投资者社区评论情感得分。使用我国第三方P2P网络借贷咨询平台数据,本文实证发现投资者社区评论情感的积极程度,能够有效预测网络借贷平台未来的破产,并且高的积极情感得分对应于平台未来较低的破产可能性。