论文部分内容阅读
P2P网络借贷模式自诞生以来备受金融界的欢迎,在近年更是发展得如火如荼。由于其门槛低、利率高、方便快捷等特点,给借贷双方都带来一定好处,尤其是对那些不满足传统金融机构借贷条件的人与中小企业来说,解决了以往融资难的问题。对我国普惠金融政策的实施与金融市场的完善也起了一定的推动作用。然而,随着P2P网贷的发展,一些弊端也逐渐显露出来。一方面,正因P2P平台门槛低,利率高,极易增加借款人的违约风险;另一方面,很多需要借款人填报的信用指标形同虚设,致使平台借款人信用数据包含大量缺值,这对后期的信用评估造成了影响,致使对借款人信用评估的准确率降低。由此,面向缺值数据,建立稳定而有效的P2P信用评估模型尤其重要,也是P2P网贷平台正常运转的基本前提。近年来,许多学者对P2P信用评估模型进行了大量研究,并取得了一定成效。然而,在已有工作中,对于缺值情况下信用评估模型的研究相对较少。因此,面向缺值数据,本文利用可以将先验知识与数据信息相结合、在消除不确定性方面具有独特优势的贝叶斯网络对P2P网络借贷的信用评估模型进行研究。所做工作具体包括以下三方面:1.提出面向缺值数据的贝叶斯网络结构学习的PQISEM算法(Structure Learning of Bayesian network based on partial qualitative influences and StructureExpectation Maximization algorithm)。将具有良好可信度和鲁棒性且容易得到的定性影响知识引入贝叶斯网络结构学习算法过程中,对在缺值情况下的参数及结构进行约束,使贝叶斯网络参数与结构更靠近真实网络。该算法在BIC评分、KL散度、运行时间等方面比其他算法更佳。2.数据预处理和基于PQISEM算法的P2P信用评估贝叶斯网络CEBN(Credit Evaluation Bayesian network)模型构建。首先,对P2P平台借款人数据做预处理,其中包括将连续变量利用ChiMerge算法进行合理离散化。然后将处理完的数据利用PQISEM算法进行P2P平台CEBN模型的结构与参数的学习,不仅提高了数据的使用率,也提高了模型的精度。3.基于P2P平台的CEBN模型进行推理预测。利用贝叶斯网络推理的原理,对借款人的还款状态进行推断预测,得出信用评估结果。实验表明其评估结果不仅在准确率上高于其他贝叶斯网络结构学习算法,而且在准确率、精度、F值等评估指标上也高于朴素贝叶斯、C4.5、SVM、Adaboost等其他分类算法。从而验证该CEBN模型的良好性能。