论文部分内容阅读
随着我国经济的高速发展,企业信用与个人信用越来越为社会所重视。但我国企业信用数据库的缺失,大量企业特别是小微企业没有信用数据。近年来,互联网的发展促进了信息的数字化,通过网络可获取大量的信用数据。同时,传统监督学习在面对少量标记数据和不均衡的数据时,具有较低的预测精度。半监督方法利用少量标记数据和大量未标记数据进行学习,同时可以克服信用数据分别不均衡和样本信息不足等问题。然而在信用评估领域效果较好的半监督支持向量机(SVM,Support Vector Machine)的参数对算法效果有较大影响,实际参数根据经验所得。因此,本文在半监督支持向量机的基础上,首先提出使用模拟退火技术寻找半监督支持向量机的最优超参数,然后使用耦合局部最优技术减少模拟退火迭校次数,并进一步提出耦合模拟退火半监督支持向量机。本文的主要工作如下:(1)半监督支持向量机的研究分析和实验对比。主要分析监督学习的支持向量机和半监督支持向量机的求解过程,并在企业信用数据集和个人信用数据集上进行对比试验。试验结果显示半监督支持向量机在信用评估领域具有较好的鲁棒性。(2)针对传统半监督支持向量机超参数需要人工经验选择的问题,本文提出了基于模拟退火半监督支持向量机的信用预测方法,利用模拟退火方法寻找半监督支持向量机最优超参数。对比传统半监督方法,实验结果显示模拟退火半监督支持向量机方法的精度最高提升13%,假正率最高降低10%,准确率最高提升11%,F-1值最高提升13%。(3)针对模拟退火半监督支持向量机方法的单一退火问题,本文提出了基于耦合模拟退火半监督支持向量机的信用预测方法,使用耦合模拟退火技术将多个模拟退火过程之间的信息进行共享,减少模拟退火方法内循环迭校次数和外循环迭校次数。针对耦合模拟退火的初始接受温度,提出了具有方差控制接受温度的耦合模拟退火半监督支持向量机。在信用数据集上的结果显示,耦合模拟退火半监督支持向量机在信用数据集上精度最高提升16%,假正率最高降低30%,F-1值最高提升3%。初始接受温度试验显示具有方差控制接受温度的耦合模拟退火半监督支持向量机可减弱对初始接受温度的依赖。