决策树算法改进及其在银行个人客户评级中的应用

被引量 : 0次 | 上传用户:sl2260ygl2260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为一种融合了多个领域的理论和技术的科学,是当前的一大研究热点。其中的基于决策树的分类算法由于简单、直观等特点得到了广泛的应用。和其他的分类算法相比,决策树算法具有计算量小、可显示重要的决策属性、分类准确率高以及较易提取显式规则等优点。本文在学习和分析现有的数据挖掘技术的基础上,重点研究了数据挖掘的数据抽样策略和决策树C4.5算法。提出一种结构化的数据抽样策略,通过有效的利用已生成的知识结构,再对预决策树进行更加具有平衡性的抽样进而形成目标数据集。实验证明该抽样方法与随机抽样方法相比,可对准确率有一定的提高。改进了决策树C4.5的连续属性处理方法。改进连续属性的分割阂值的选择方法,同时引入了新的两个变量,省略原C4.5算法中的两次顺序查找。实验证明,该改进算法有效地提高了运算执行效率,节省了一定空间,同时不会对决策树的生成造成影响。同时,本文基于互联网上的银行个人信贷信息,采用新的数据抽样策略和改进后的决策树C4.5算法进行建模,从分类预测的结果来看,该模型有着精确度较高、效率更高、空间更少的优点。
其他文献
随着信息产业的迅速发展,人们对无线通信系统提出了越来越高的要求。由于射频功率放大器在无线通信系统中的重要作用,如何设计出性能良好的功率放大器已经成为引起人们广泛关
本课题研究了一个有智能可调节的匹配网络的宽带功率放大器。解决的主要问题有:1、研究分析了大信号S参数回推的方法,解决了器件厂商无法提供所需频点处的大信号S参数的问题
高校的信息化发展已从传统的信息技术普及发展到大数据的决策支持,作为教学的主体教师,应当积极培养数据素养,从而更好地利用大数据技术为教学服务。数据素养的组成包含三个
目的观察川芎嗪对急性脊髓损伤患者术后神经功能恢复的影响。方法选择脊柱骨折脱位伴急性脊髓损伤患者72例,随机分为观察组和对照组各36例。两组均根据骨折脱位情况,采取前路
为研究多尺寸聚丙烯纤维混凝土的抗弯韧性,采用四点弯曲试验对30个长×宽×高为400mm×100mm×100mm的聚丙烯纤维混凝土试件进行研究,得到纤维混凝土梁的荷
以寻求适合产品平台的参数化设计方法为目标,探讨了传统参数化设计方法的不足,分析了面向产品平台的参数化设计的基本功能;提出参数化设计资源的概念,建立了基于.NET Frameworks的
随着经济全球化和各国文化交流的加深,文化贸易在全球范围内迅速发展并改变着传统的经济形式,对世界格局、经济发展趋势产生着重要影响,已经成为推动经济增长、培育创新能力
地下水是水环境不可分割且十分重要的一部分。据估算,全世界的地下水总量多达1.5亿立方公里,几乎占地球总水量的十分之一,比整个大西洋的水量还要多!在我国,2006年全国矿化度
“武装工作是党的一项重要工作,作为一名党政领导,如果思想上不重视,行动上不亲自带头抓落实,就是工作严重失职!”这不仅是江西省九江县县委书记吕斌在领导武装工作中的自我
系统地讨论了大气颗粒物中PAHs的研究状况,并对其来源和分布、采样技术、样品预处理、分离分析方法进行了阐述。