论文部分内容阅读
本文的主要工作是运用数据挖掘的相关技术对个人住房贷款的大量数据进行数据挖掘,发现隐藏在大量数据中的隐含模式,最终得到风险评估模型。 本文的研究内容主要分为个人住房贷款风险评估体系的建立、数据采集、数据预处理和模型建立四个部分,而且这四个部分都基于数据挖掘的有关理论,根据业务需求并按照数据挖掘工作的一般步骤展开的。其中,风险评估体系的建立是基础,数据采集和预处理是为挖掘所做的准备,建立模型则是数据挖掘在个人住房贷款中应用的最终结果。因此本文研究内容的四个部分之间是紧密联系的,也是任何一项数据挖掘工作都必不可少的关键环节。 具体来说,本文的研究内容主要有以下几个方面: 1.依据个人住房贷款的业务信息并通过专家咨询,设计和选择与个人住房贷款风险形成密切相关的因素,完成个人住房贷款风险评估体系的建立。 2.根据风险评估体系,分析研究原始数据库的数据,经过数据处理过程,对原始数据做出选择,得到与风险评估有关的个人住房贷款处理数据集,这也是进行数据挖掘任务后续步骤的数据基础。 3.数据预处理是数据挖掘整个过程中至关重要的一步,它决定着以后挖掘的质量。本文在兼顾数据质量和计算效率的基础上选择较为完善的预处理方法对个人住房贷款处理数据集进行了一系列的处理,得到了适合挖掘的挖掘数据集。此外,还对一些重要的预处理方法做了较为深入的研究和实践。 4.在数据挖掘理论的指导下,通过比较挖掘方法选择适合本研究的方法,本文选择决策树分类技术和聚类技术得到个人住房贷款信用风险评估模型和一些规则。本文对该模型和规则进行了测试和评价,得出它们预测准确率较高的结论。最终实现了能够从真正意义上帮助银行信贷人员进行信贷分析,为银行领导做出正确决策提供支持的目标。