基于数据挖掘的信用卡申请者信用评分模型研究

被引量 : 0次 | 上传用户:oa001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国改革开放的逐渐深入,居民的消费观念不断更新,银行业个人信贷业务的热点也相继涌出。在房贷和车贷之后,作为既是日常生活消费的支付工具,也是非计划性(non-target)循环贷款的信用卡业务,从2003年开始就吸引了各中外商业银行的眼球。这也归因于各大商业银行看准了信用卡业务潜在的高额利润和巨大的市场空间。众所周知,对于绝大部分银行业务而言,收益总是和风险相伴而行的。高的收益总要承担高的风险,没有风险的业务不一定是好业务,逃避风险则意味着盈利机会的丧失。信用卡成功的关键在于强大的风险管理能力,而不是风险逃避能力,也就是说通过承担一定的风险,并对其进行有效管理,以实现收益最大化。由于信用卡业务具有信用风险、利率风险、汇率风险、流动性风险等多种风险,各风险又存在于信用卡业务经营的每个环节,要想一蹴而就地建立一个全面、有效的信用卡风险管理体系几乎是不可能的。即使引进外资银行先进的经验,也会因为国情的较大差别,需要较长时间的学习和消化。所以,本文仅就信用卡风险管理的征信环节中对信用卡申请者的信用评分进行研究,并开发一个基于研究结果的信用卡管理系统。信用评分是对每个申请者的信贷风险进行目标明确的定量评估,即用分数定量表示信贷风险。信用卡申请者信用评分属于消费信贷信用评分法,它有两个最基本的假设:第一,一个人过去的表现可以表征其未来的行为;第二,具有相同背景和行为特点的人,会有同样的表现。美国征信机构的庞大数据库以及统计分析,总体上支持这两个假设。信用评分的具体方法有很多种,从本质上来讲,可以大致被划分为三类。它们分别是基于规则的评分方法、基于行为的评分方法和神经网络模型评分方法。本文提出的基于数据挖掘的信用评分可归于基<WP=4>于行为的评分方法。数据挖掘(DM:Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域,近年来受到各界的广泛关注。数据挖掘最吸引人的地方是它能建立预测模型而不是回顾型的模型。目前在美国,数据挖掘技术已广泛地应用于信用评估、欺诈发现、客户保持、营销策划、价格制订、投资组合分析、财务分析、安全管理和战略规划等银行经营、管理和决策的各个方面。可以说,数据挖掘技术已成为美国商业银行在竞争中的制胜关键。利用数据挖掘技术来建立信用卡申请者信用评分模型能为银行信用风险管理提供了一个客观、准确、一致的评估和控制机制。借助数据挖掘技术,从已有的大量的有关客户背景、行为和信用的数据中,银行能挖掘出“好客户”和“坏客户”的背景特征,包括年龄、收入、职业和教育水平等不同属性,并能计算出不同属性值对客户信用大小的贡献权重,从而建立起能更为科学的评估客户信用大小的数学模型,帮助银行建立信用风险监控的第一道防线。这次研究所使用的数据挖掘工具是SAS系统软件,且主要是使用其中的把强大的统计分析功能和容易使用的图形化界面结合的Enterprise Miner模块。并按照SAS公司提出的“SEMMA”方法论,即在通过数据抽样,数据特征探索,数据调整,建模和模型评价五个步骤来建立信用评分模型。本文采用了两个建模方法:一个是决策树,另一个是Logistic回归。这次分析和建模目标是通过对已有大量的客户基本信息及相关资料使用数据探测,建立决策树模型和logistic回归模型等方法,并进行对比分析,以求能够找到最佳模型。再根据最佳模型实现对客户的信用风险状况进行分析和评分,并得到准确区分好客户和坏客户的最佳信用分值,以便信用卡公司能高效的应对大量的信用卡申请者,快速地做出接受还是拒绝的判断,以及对接受的申请者根据其信用高<WP=5>低给出不同的信用额度和其他信用政策。经过具体的研究和分析,本文得出主要两点:对于信用好的客户,即信用评分在前20%的客户,两个模型都有很好的预测能力,且Logistic回归模型明显优于决策树模型;对于信用差的客户,我们可知决策树的预测能力不好,它只把50%的坏客户判为坏客户,而Logistic回归模型的预测能力很好,把高达92.6%的坏客户判为坏客户。可见,Logistic回归模型正好能满足我们这次研究的目的,即能相当准确的对信用好的客户和信用差的申请者进行评分,所以本文选择Logistic回归模型作为信用卡申请者信用评分的最佳模型。运用建立的Logistic模型对信用卡申请者进行信用评分,分值高于或等于临界分值(C1=83.85)的申请者将获得通过,并给予较高的信用额度;信用分值低于临界分值(C0=48.43)的申请者将被直接拒绝。而信用分值低于临界分值(C1=83.85),但高于或等于临界分值(C0=48.43)的申请者也将获得通过,但只给予较低的信用额度,他们需要通过以后的良好的用卡情况来提高信用额度。这样银行就能以承担较低的信用风险来获得盈利的机会。接着本文运用上面研究的结果开发了一个信用卡管理系统,它也是国家“十五”项目?
其他文献
随着数字摄影测量技术的发展,低空无人机摄影方式得到了很大的重视。在灾害应急领域,可帮助获得受灾地区高质量的正射影像图、DEM和全景图等产品,及时获取灾区的准确信息,为
<正> 迷宫密封活塞式压缩机的密封结构为非接触式,活塞及填料函均依靠迷宫进行密封。因此,不会因气体中含有固体颗粒而影响它的密封性及使用的可靠性。这就使迷宫式活塞压缩
一、研究背景与选题意义股利政策是现代公司理财活动的三大核心内容之一。一方面,它是公司筹资、投资活动的逻辑延续,是其理财行为的必然结果;另一方面,股利是不同利益主体合作与
运用酒精、硬脂酸、氢氧化钠、酚酞、硝酸铜、硝酸钴等原料,制备彩色固体酒精。通过实验得出了最佳工艺条件。在应用化学实验中特增设了“固体酒精的制备”实验。
分析了甲醇装置生产单元的主要危险危害因素,提出了装置设计及安全管理的保障措施。
为解决规划信息资源的集约化管理和高效共享利用问题,规划一张图系统利用GIS技术,以规划数据资源体系的梳理与整合为基础,通过制定一套数据标准与技术规范、开发一张图应用系
在性别、年龄、居住地等不同条件下的老年人群体中,采用问卷法对208名老年人进行施测,探讨他们老化态度、孝顺期待和传承感之间的关系.结果发现,老年人的老化态度和传承感不
针对我国汽车维修业的发展和现状 ,对汽车维修专业人才的基本要求、知识结构、培养模式进行了探讨 ,并对汽车维修专业的教学从课程体系、教材内容、教学方法和教学条件几方面
介绍了以AutoCAD为平台所开发的组合机床多轴箱传动总体方案设计CAI课件的主要设计思想 ,并对设计过程中的一些关键技术作了简要说明。
国有商业银行是我国金融体系的重要组成部分,随着金融业的不断调整,加入WTO之后中国金融市场的进一步开放,国有商业银行面临前所未有的竞争压力。通过股份制改造而最终成为真正