论文部分内容阅读
网络借贷信用评价能够有效地缓解借贷双方间的信息不对称性,降低违约风险和交易成本。然而,网络借贷业务中借款人的财务信息难以获取和验证,给传统的基于财务信息的信用评价方法带来巨大的困难。事实上,网络环境下,借款人的信用相关数据不仅包括财务信息,也包括非财务信息。这些非财务信息广泛分布在不同的网络平台中,具有体量大、价值密度低和质量参差不齐等特点,给网络借贷信用评价研究带来新的困难。为此,本文在综述信用评价相关理论与方法的基础上,结合网络借贷业务的特点,从信用评价的数据预处理、信用特征选择和信用评价模型构建三个方面,对网络借贷业务的信用评价问题展开研究。研究的主要内容和相关结论如下。(1)网络借贷个人信用评价数据预处理方法网络借贷业务信用评价数据的质量参差不齐,缺失值和异常值现象严重。在缺失值处理方面,针对多重填补法难以对包含类别变量的数据集进行缺失值填补的问题,提出一种分类多重填补法。该方法利用类别变量与连续变量数学特征间的关系,根据类别变量信息对连续变量的相关数据特征进行估计,提高缺失值填补效果。在异常值处理方面,针对单一信用特征的异常值处理问题,提出一种基于KNN的异常值纠偏方法,该方法能够利用近邻样本的相关信用特征对异常值进行纠正。针对密度分布不均匀空间中的异常样本检测的距离阈值难以确定问题,提出一种基于DBSCAN和相对密度的异常样本检测方法。该方法首先利用DBSCAN算法将密度分布不均匀空间分成若干个密度分布均匀的类,然后在每个类中运用相对密度方法确定异常样本。最后,在拍拍贷平台上进行信用数据预处理实验,结果表明经过预处理的数据能够显著增强信用评价模型的性能。(2)网络借贷个人信用特征选择方法网络借贷业务信用信息的体量大,价值密度低。需要结合相关理论与方法,对信用特征进行定性初选和定量筛选。在信用特征定性初选阶段,结合信用所具有的资本性和社会资本理论,从结构维度、关系维度和认知维度三个方面,分析网络借贷业务中借款人的社会资本,并结合借款人的个人信息、借款历史信息和身份验证信息等,研究融合社会资本的信用特征定性初选方法。在信用特征的定量筛选阶段,考虑到信用特征的变量类型多样且与信用状态变量间的关系复杂,提出一种基于综合定量分析的信用特征筛选方法,该方法运用相关分析、卡方统计量分析、信息增益分析和支持向量回归分析等定量分析方法,筛选与信用状态变量具有线性和非线性关系的定类与定距信用特征。最后,在拍拍贷平台上的实验结果表明,提出的信用特征初选和筛选方法能够全面获取多变量类型和多关系类型的信用特征。(3)网络借贷个人信用评价模型现有的信用评价模型在网络借贷环境下的应用效果不佳,需要对现有模型进行改进并结合网络借贷环境下信用表现出的相关特性,设计新的信用评价模式和模型。现有的Adaboost集成学习模型仅根据误分类率调整基分类器的样本权重,忽略了分歧度和误分类成本等因素对于样本权重的影响,造成集成后的模型精确度下降。为此,提出一种基于分歧度与误分代价的Adaboost信用评价模型,该模型能够对分类困难样本和误分代价高的样本进行有针对性的学习,提高信用评价结果的准确性。在拍拍贷平台上的实验结果表明,基于分歧度和误分代价的Adaboost信用评价模型的性能显著优于传统的Adaboost模型。此外,网络借贷环境下,根据信用表现出的全息性,设计一种Peer-to-Peer协同信用分析机制,获取并集成评价对象在多个网络平台上的相关信用特征,建立基于协同分析模式的跨业务的信用评价模型,从而对借款人的信用做出更加全面的评价。在相关的网络借贷平台、电子商务平台和社会网络平台上的实验结果表明,基于协同分析的跨业务信用评价模型能够有效地提升信用评价结果的有效性。