基于决策树的数据挖掘算法及在贷款风险分类的应用

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:bm_imba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库蕴含着大量信息,可以用来作出各种智能的商务决策。作为新兴的知识发现技术——数据挖掘以及辅助决策工具——决策支持系统已越来越受到人们的关注,它们为人们从大量数据中获取感兴趣的、有用的信息提供了便捷之道。 随着数据挖掘技术以及人工智能技术的不断发展,智能决策技术在许多领域得到研究和应用,并发挥着越来越重要的作用。本文就是基于数据挖掘和决策支持系统领域的相关知识和技术,针对商业银行的信贷业务中的关键环节——贷款风险分类,进行了理论和方法上的研究。 在数据挖掘的众多功能中,分类是其中一项非常重要的任务,它通过找出描述并区分数据类或概念的模型,以便能够使用模型预测类标号未知的对象类。决策树算法是以实例为基础的归纳学习算法,以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和较高的分类准确率等优点而得到广泛的应用。据统计,目前决策树算法是利用最广泛的数据挖掘算法之一。 基于银行的IT现状,笔者将改进的决策树算法应用于银行智能决策系统的信贷分析系统,用决策树的技术来实现银行贷款风险分类,以提高银行降低不良贷款比例的能力。为此,本文主要进行了以下几个方面的工作: 1、数据挖掘基本知识的深入研究及探讨。介绍了数据挖掘技术的基本理论,数据挖掘基本概念、功能和过程,并对数据挖掘常用技术进行了分析。 2、决策树技术的分析与研究。通过第三章,对C4.5算法及其基本思想进行了归纳、分析和研究,分析了其优缺点,并引入了粒子群算法来改进C4.5算法。 3.针对传统决策支持系统的局限性,介绍了基于数据仓库的决策支持系统,并分析了数据挖掘技术在决策支持系统中的地位与作用。并提出了银行智能决策系统总体解决方案。 4、介绍了决策树技术在银行贷款风险分类中的应用。利用改进的C4.5算法生成决簧树模型,并由此产生了分类规则。
其他文献
随着数据库和计算机网络技术的广泛应用,许多大型数据都以分布式形式存储在分布的数据库中,如何从分布的数据库中挖掘有价值的知识是一个具有挑战性的研究课题。关联规则挖掘
近年来,视频技术和无线网络技术得到了飞速发展,基于无线环境的视频应用已经融入人们的日常生活当中。与传统的视频应用不同,移动视频应用中存在着信道带宽窄且波动性大、终端的
随着互联网技术的发展,大量的计算机聚合到一个逻辑的服务平台成为可能,由此产生了一个被称为网格(Grid)的新一代网络环境,构思了像电力网一样“即插即用”地从网格中得到包
近年来,随着计算机科学技术的不断发展和推广,网络传输带宽和计算机处理速度的增长,数字视频信息出现了飞速膨胀,越来越多以前靠人力完成的工作都已经被计算机所取代,视频监控技术
学位
随着网格技术和Web服务的不断融合,以服务方式对外提供计算、存储等资源成为网格发展的趋势,并为网格研究指明了广阔的前景。如何科学准确的评价基于Web服务构建的网格系统平台
本体理论属于人工智能的理论范畴,研究特定领域知识的对象分类、对象属性和对象间的关系,为领域知识的描述提供术语。它是语义Web的基础,可以有效地进行知识表示、知识查询或不
学位
Internet的普及和网络技术的飞速发展使人们面临一种网络信息爆炸性增长的现状,基于文本的垂直搜索引擎因其能够在海量信息中对某些特定垂直领域的信息进行快速检索的突出能力
学位
智能车环境下的物体检测与识别是智能交通领域的关键问题。在智能车视觉系统中,行人、车辆和交通标志是三大最重要的视觉对象。尽管行人、车辆的检测和交通标志的识别已被广泛
随着人们生活水平的提高,家庭网络日益普及。作为家庭网络技术的核心,家庭网关不但能够实现外部网络和家庭内部网络的通信以及协议转换工作,而且能够实现对家庭网络中设备的IP分
物理不可克隆函数(Physical Unclonable Function,PUF)是一种新型硬件安全原语,它利用生成制造中的工艺偏差产生的随机物理特性形成由激励到响应的函数,因而具有生产制造前难以