论文部分内容阅读
随着“互联网+”的发展,大数据不断的改变着我们的生活,个人信用在大数据环境变得更加重要,个人信用是由个人信用评价方法决定的。信用评价是商业银行控制风险的关键技术,发生在美国的“次贷危机”就是信用风险的大爆发,因此信用评估方法的研究具有非常重要的现实意义。信用评估实质上是数据挖掘中的分类问题———将贷款者根据其属性分成能够按期还本付息的可信的“好”客户(正类)和违约的“坏”客户(负类)两类,进而预测未来贷款人的违约风险,为消费信贷决策提供科学依据。本文针对科学实用定量信用评价方法学术问题,以贝叶斯网络为理论基础,采用机器学习方法,提出了基于贝叶斯网络理论的个人商业贷款定量信用评价模型。兼顾准确率和效率并考虑不同的应用场境,分别构建树增强朴素贝叶斯网络、马尔科夫毯、特征选择马尔科夫毯三种评价模型。以机器学习学术界国际公认机构的公开数据中“德国信用卡数据集”为数据源,分别对三种模型进行了实证研究。实证结果表明三种模型可行、有效但准确率和效率不同,其中,树增强朴素贝叶斯网络模型准确率最高、效率最低,特征选择马尔科夫毯模型准确率最低、效率最高,马尔科夫毯准确率和效率均居中。最后对三种模型应用场景进行了分析和推荐,如果数据属性特征明显,数量不多,准确率要求较高,则可以选择树增强朴素贝叶斯网络模型,该模型适用于传统中小型分布式数据处理环境;如果原始数据属性众多,准确率要求不严格,则可以选用特征选择马尔科夫毯模型,该模型适用于现代大数据集中处理的环境;马尔科夫毯模型介于两种模型应用场景之间。本文也将实验结果和其他几种个人信用评估模型进行比较,发现本文所建立的个人信用评价模型具有较高的准确度,并推荐在大数据环境下优先使用特征选择马尔科夫毯个人信用评价模型。本文提出了树增强朴素贝叶斯网络、马尔科夫毯、特征选择马尔科夫毯三种个人贷款信用评估理论模型并进行了实证研究,和其他评价模型进行了对比,提出了在大数据环境下应当使用特征选择马尔科夫毯模型,应用前景广阔,下一步的研究目标将相关理论模型转换成具体的应用软件原型。