个人信用评分组合模型研究与应用

被引量 : 74次 | 上传用户:sjzafei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个人信用不仅是国家建设道德文化和市场伦理的基础,还是一个推动国家经济发展的巨大资源。充分开发和利用个人信用资源,能够有效地优化资源配置、拉动消费并最终促进经济发展。一些西方国家早在一百多年前就建立了个人信用制度,为其市场经济的正常运行打下了坚实基础。而在我国,个人信用制度的建立在2000年才开始起步,研究和应用水平远远落后与发达国家。个人信用评分是个人信用制度的核心,科学地对个人信用状况进行评估有助于促进个人信贷业务的发展,降低个人信贷风险。本文在分析国内外个人信用评分发展历史及其方法应用现状的基础上,指出目前个人信用评分是一个集缺失数据填补、异常值检测和处理、连续数据离散化、样本结构优化、指标体系选择、模型设计、评价和应用为一体的评估系统。针对缺失数据问题,将多种填补方法的应用效果进行了比较。得出在数据缺失率在10%以内时采用删除法是最佳选择,在20%~40%之间时多重填补是最有效的处理方法。对异常值和异常实例的检测及处理进行了分析,提出了异常实例检测的组合方法,结果表明异常值的处理有助于提高个人信用评分模型的分类精度。采用等距区间、等频区间以及基于熵的方法对连续属性进行了离散化,结果表明离散化能够减小异常值对个人信用评分模型的影响、提高评分模型的预测精度,有利于个人隐私的保护。在数据层面和算法层面对信用数据中的结构不平衡问题进行了研究,实验结果表明两个层面上的处理方法都能有效地提高对坏客户的识别正确率。其中基于最近邻的SMOTE过抽样方法简单易行,在处理不平衡数据问题时有最好的应用效果。在对各种指标重要程度排序方法进行比较的基础上,提出采用组合方法能够综合考虑各种排序信息,获得更为稳健的指标重要性排序结果。测试了机器学习中的最优特征子集选择方法在个人信用评分指标体系构建中的应用效果,为构建个人信用评分指标体系提供了新的思路。对五种最常见的个人信用评分单一模型进行了应用和比较,实验结果表明:Logistic回归对数据没有严格假设条件、稳健性好、可解释性强、建模过程简单易操作,但分类精度略低于人工智能模型。C4.5决策树模型对数据没有严格假设条件、模型分类精度较高、可解释性较强,能输出简单直观的评分规则,但缺点是模型稳健性不够,容易出现过拟合,且建模过程比较依赖专家知识和经验。贝叶斯网络的稳定性好、可解释性较强,能输出网络图,直观地揭示属性和违约概率之间的关系、建模过程简单易行,但主要缺点是模型分类精度较低。BP神经网络对数据没有假设条件、分类精度高,能模拟数据间复杂的非线性关系,但缺乏稳健性和可解释性,而且建模过程严重依赖专家知识和经验。支持向量机对数据也没有假设条件、分类精度高。但缺点是缺乏可解释性和稳定性,建模过程依赖专家知识和经验。总之,目前存在的多种个人信用评分统计模型和非统计模型都各有特点,没有一种能够达到分类精度和稳健性的统一针对精确度与稳健性无法兼顾问题,本文利用组合思想构建了多种结构的组合模型并进行了应用。实验结果表明,把神经网络或支持向量机和Logistic回归按照串行结构结合在一起构成组合模型有助于提高信用评分的分类精度和稳健性。但由于多重共线性的存在,使模型丢失了可解释性。异态并行结构组合模型能显著提高分类精度和稳健性,但是模型构造复杂,依赖于专家知识和经验,不利于推广应用。Bagging、boosting集成模型在分类精度和稳健性上也都有很好的表现,而且构造相对简单,较少依赖专家知识和经验,有利于在个人信用评分领域的推广。Rsm集成模型能在高维度的数据集上取得了和bagging、boosting集成模型相当的分类性能,但不适合处理特征变量过少的个人信用评分问题。基于聚类的bagging集成个人信用评分模型的应用结果表明,先将样本进行聚类,然后再在各个类上构建基分类器能够有效的增加基分类器间的差异性,并能提升组合模型的分类精度,但其前提是合理地选择聚类水平,且这种方法不适合处理数据量小的个人信用评分问题。基于聚类的选择集成模型的应用结果表明,通过聚类来增加基分类器的差异性的方法是有效的。但聚类选择仅能提升Bagging集成模型的分类精度,对Boosting算法影响不大。
其他文献
军事装备思维是科技与人文协同发展的产物。一定历史时期的军事装备思维总是自觉或不自觉地统一在这一时期特定的思维模式中;系统思维、辩证思维与创新思维是现代军事装备发
随着医院不断发展,对医院管理提出了更高更细的要求。本文分析了医院内部行政管理的现状和存在的主要问题,借鉴"无缝隙"管理理论,探讨医院行政管理科学化、精细化,进一步促进
21世纪初,中国当代艺术日益繁荣,呈现出流派纷纭,风格多样,人才辈出的多元化发展趋势,成为全球艺术的新生主力。中国当代艺术由绘画发展到综合材料、装置等形式,纸作为多元化
固定资产是高校开展教学、科研活动的物质基础和保障。随着高等教育体制改革的发展和高校办学自主权的提升,高校固定资产的规模日益扩大,在资产总额中占有极大的比重。但是,目前
近年来,随着智能手机性能的不断提高以及人们对手机依赖程度的不断加强,移动通信设备的飞速发展产生了许多游戏开发的开发平台,J2ME、android等等,其中J2ME开发技术已经日趋
高速公路建设具有投资大、工程复杂,影响因素多,质量要求高的特点。其质量管理问题尤为重要,本文从理论与实际结合的角度研究凤大高速公路工程的质量管理与控制问题,系统地分析了
目的探讨临床生化检验常用指标干扰消除脂血的措施。方法选取84例健康体检志愿者作为本研究的对象,抽取空腹状态下静脉血5 ml至真空采血管中,制备高甘油三酯混合血清和乳糜干
随着我国金融市场改革的不断加快,金融创新速度也不断加快,金融市场上涌现出越来越多的金融创新产品。近几年以来,除了原来已被广泛认知的股票和债券外,资产证券化成为金融市场上
医疗损害责任归责原则体系的建构,应该说是一个庞大而系统的工程,牵涉到诸多方面配套法律制度的完善,而鉴于我国目前在医疗损害责任领域广泛存在的问题,现阶段我们所要做的是:充分
本文对俄罗斯教堂的屋顶装饰艺术进行了全方位的分析,从造型和色彩两个方面分别诠释了俄罗斯教堂屋顶的装饰风格和装饰语言。