应用决策树构建个人住房贷款风险评估模型

被引量 : 15次 | 上传用户:junpenge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要运用数据挖掘中的决策树技术对经过预处理后的个人住房贷款挖掘数据集中的数据进行分析,发现隐藏在大量数据中的隐含模式,最终得到个人住房贷款风险评估模型。本文研究的内容主要包括数据采集、数据预处理以及模型的建立,而这三部分又是基于数据挖掘以及决策树的相关理论,根据业务需求并按照数据挖掘工作的一般步骤展开的。论文针对我国商业银行信贷资产质量低下和风险加大的客观情况,借鉴外资银行应用数据挖掘决策树技术建立客户信用评价系统的成功经验,在明确挖掘目的的前提下,深入理解数据挖掘、决策树、数据采集、数据预处理、聚类分析以及模型评价等方面的相关概念。在此基础上,结合本文研究的问题以及数据的特点,通过各种方法的分析与比较,用适合的数据采集和预处理方法对数据库中的一半数据进行处理,建立适合挖掘的数据集,应用决策树C4.5算法以及聚类k-平均算法对这些数据进行挖掘和分析,通过计算风险度量值和决策影响程度值,确定每个属性各个取值的分数值,得到个人住房贷款风险评估模型。最后使用剩余的一半数据作为测试样本来评价这个模型,证明此模型具有较强的预测能力,是当前商业银行可以采用的最优模型,值得在实践中推广。具体来说,本文的研究内容主要有以下几个方面:1.针对我国个人住房贷款违约率上升的现象,借鉴国外银行取得的成果,提出使用数据挖掘决策树技术构建个人住房贷款风险评估模型将会给商业银行带来很多直接效益。2.通过数据挖掘分类算法的比较,选择决策树技术以及经典的C4.5算法作为本研究使用的算法,并介绍其基本理论。3.依据数据挖掘步骤,明确挖掘目的,以某商业银行个人信贷数据为分析对象,分析研究个人住房贷款原始数据库的数据,通过随机序列发生器,从中随机抽取一半数据作为本研究的样本数据,得到个人住房贷款处理数据集,为数据挖掘后续步骤奠定数据基础,另外一半将被用来测试。4.兼顾数据质量和计算效率,对一些重要的预处理方法深入地研究和实践,选择较为完善的预处理方法对个人住房贷款处理数据集进行了一系列的处理,得到适合挖掘的个人住房贷款挖掘数据集。5.在数据挖掘及决策树理论的指导下,使用决策树分类技术和聚类技术,应用C4.5算法计算信息增益率创建决策树,在此基础上,计算风险度量值和决策影响程度值得到个人住房贷款风险评估模型,进而通过聚类k-平均算法划分风险评估等级。6.使用原始数据库中的另一半数据对个人住房贷款风险评估模型进行测试和评价,证明其预测准确率较高,稳健性好,易于理解,效率高,推广能力强。
其他文献
<正>随着人们生活节奏和办公效率的加快,很多企业意识到会议管理信息化在决策中的重要作用,开始纷纷引进信息化会议管理系统来辅助企业的运营、搭建企业的管理通道,从而实现
<正>进入了5月份,北京城地区天气逐渐变热。时下遍布京城地区市内及周边地区大大小小的装修用材和木材市场,可谓人气开始回升转旺,其中建筑用大型木材和装饰装修用材及地板、
随着经济的不断发展,外商直接投资(Foreign Direct Investment)越来越受到各国的重视,因为外商直接投资是集资本、知识、管理于一体的“一揽子”创造性投资,成为最重要的知识
拉卡托斯的科学研究纲领是在借鉴了库恩的常规科学解题方法、修正了波普尔的朴素证伪主义之后逐步发展起来的,由理论硬核和辅助性假设带两部分构成。此后,许多科学家和理论家
<正>根据《全日制义务教育历史课标准(实验稿)》,人教版教科书推出了"活动课"这一教学形式。几年来,在如何上好历史课堂活动课上我进行了一些初步的尝试,下面仅就
<正>音乐课在中学教育中的主要任务是培养学生的音乐素养,提高学生的综合素质,是一门不可或缺的学科。根据音乐课的特殊性质,我认为中学音乐课堂教学氛围创设可以从以下几个
作为一种辞格的双关由来已久,历来广受修辞学家和语言学家的关注。有关英汉双关语的独立和对比研究成果颇丰,研究角度涉及哲学、美学、传统的文艺理论、功能语言学、语用学、
从微生物次生代谢物中筛选生物活性物质是新农药研究与开发的一个重要途径。截止目前为止,已经明确结构的微生物次级代谢产物超过50000多个,其中具有明确生物活性的化合物220
21世纪是知识经济的时代,它以现代科学技术为核心,建立在知识和信息的生产、存储、使用和消费之上。知识经济的实质在于以知识的不断创新带动经济发展的质的飞跃,就是知识创新。