论文部分内容阅读
二次世界大战以后,消费信贷产业在欧美蓬勃发展,与此同时消费信贷业务风险与回报相对应的客观规律,使金融机构在追逐巨额利润的同时,不得不面对巨大的潜在坏账风险,从而使信用风险管理成为消费信贷管理的一个核心领域,银行需要客观、全面、准确地评估消费者的还款能力和还款意愿,以避免、控制、减少坏账损失。信用评估模型技术的发展和应用,首先应消费信贷金融机构风险管理的需要而诞生,然后逐步应用到市场营销管理和收益管理等领域。
促进信用评分发展的另一个重要因素是欧美社会征信体系的形成与健全,包括完善、丰富、全面的信用信息收集、汇总、加工、使用机制,其核心主体是信用局,如美国的Trans Union、Equifax和Experien三大全国性信用局,它们对消费者全面的信用历史信息如住房贷款、汽车贷款、信用卡贷款、个人贷款、耐用品贷款、房租、水电费、电信费等信息进行收集、加工、整理,并为消费信贷机构提供消费者信用报告和信用数据。
银行客户信用评估是根据客户信息评判客户信用程度的过程。信用评估是欧美消费信贷管理中广泛应用的技术手段,也是银行、信用卡公司、汽车贷款公司、住房贷款公司、个人贷款公司、电信公司、公共事业公司、保险公司等涉及消费信用的企业实体最重要的核心管理技术之一,因此有必要研究银行客户信用评估的模型和方法。
在金融保险(例如银行、投资公司、信用卡公司、保险公司)界,每天都会收到成百上千的贷款或保险请求,这就需要一种方法、手段或系统来对这些客户的信用度进行评估,以便对接受或拒绝申请作出判断和决策。
数据挖掘是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及潜在应用价值的信息或模式,它是数据处理和分析中的一个很有应用价值的方法和技术。数据挖掘能够预测将来的趋势和行为,从而很好地支持决策。将其运用到银行客户信用评估,就能在庞大的数据中将看似无关联的数据进行筛选和净化,提取出有价值的信息,对客户贷款申请做出恰当的回应。
本课题采用数据挖掘方法建立和实现了三种银行客户信用评估模型,并在此基础上对评估结果进行比较分析。主要研究工作和成果如下:
1)对样本数据库中的数据进行预处理,分别应用logistic回归方法和ID3算法建立了银行客户信用评估模型;
2)改进了ID3算法,并应用它建立了银行客户信用评估模型;
3)对以上三种评估模型的试验结果进行分析比较,得到了一些有益的结论;
4)以Agent为基础,建立了银行客户信用评估系统的体系结构。
研究表明,分类树的分类性能要比回归模型好,但Logistic回归相对简单,而分类树具有较好的灵活性,实际应用广泛,但对计算资源要求很高,而且算法的复杂性很大程度上依赖于观测数据。而改进的ID3算法建立的决策树,不但可以加快决策树的生长,而且可以得到结构简单的决策树,便于从中挖掘出易于理解的规则信息,从而能够深入地了解哪些因素对客户的信用评估有较大的影响。综合比较,改进的ID3模型在3种评估模型中效果最好。