基于改进随机森林算法的信用评估研究

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:zhouyongaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,伴随着经济高速发展,人们的消费观念也正在逐步转变,我国个人信用消费在规模上不断扩大。个人信用是建立在彼此信任的基础上,按照一定的协议而提供给个人的信用,比如银行可以根据个人信用来决定是否给客户贷款等等。进行合理有效的个人信用评估,不仅有利于保证银行的正常运转及国家的经济安全,而且也能更好的发展银行业务,带动消费增长和国家经济发展。但是伴随着社会欺诈,违约等现象逐渐增多,因此判断客户是否诚信,在贷款时是否会发生信用欺诈,违约现象非常重要。当下,伴随着我国个人信用消费发展迅速,也出现以下问题,一方面是目前个人信用体制还不够健全、另一方面是银行数据库中存在不平衡数据集会降低信用评估准确率。以上这些问题都可能导致银行遭到巨大损失。为了解决这些问题,提高个人信用评估准确率,对我国个人信用消费规模的发展具有非常重要且深远的现实意义。在海量的数据集中,随机森林通过自助采样获得数据子集,这些数据子集构建决策树能得到很好的分类预测效果。随机森林具备预测准确率高、时间复杂度低等优点使其在很多领域都有广泛的应用,比如互联网攻击识别、医学诊断、图像处理等等。综合这些优点,随机森林同样适合应用在个人信用评估研究中。本文进行了基于改进随机森林算法的信用评估研究,首先对影响信用评价的一些指标进行分析,建立相应的指标体系;然后根据建立的指标体系来建立模型进行分类。但在实际应用中,因为个人信用所获得的数据常常表现为不平衡数据,所以在数据处理方面经常引入欠采样和过采样方法。由于欠采样方法可能会失去许多样本的信息,而过采样方法可能会使少数类样本过拟合。本文提出了一种新的基于混合采样的随机森林算法(BSI)。首先通过引进“变异系数”找出样本的稀疏域和密集域;然后针对稀疏域中的少数类样本,提出了一种改进的过采样方法(BSMOTE),对密集域中的多数类样本,提出了一种改进的欠采样方法(IS);最后将平衡后的数据集送入随机森林分类器中进行训练。在对个人信用评估的研究中,通过实验表明,该算法与传统算法相比,取得了更高的G-mean值,F-value值,AUC值,具有更高的信用评估准确率。
其他文献
网络自制剧在现今多元的传媒环境下作为一种新的传播现象脱颖而出,并以破竹之势迅速得到众多网友的追捧,成为影视界的“新宠”。本文尝试从“使用与满足”视角探析网络自制剧
随着现代科技的快速发展,高频超声在科研和工业领域,如超声医疗检测、超声无损检测等领域的应用日益成熟。利用声辐射力实现生物医学领域实现细胞筛选、药物输送作用,以及在
旅游会展经济对调整社会经济结构,促进区域经济发展非常重要,但目前却面临着外语人才结构性短缺等问题。本文以厦门为例,在考察厦门旅游会展业发展现状的基础上,结合外语人才
目的:探讨红细胞生成素在治疗化疗相关性贫血的过程中对小鼠乳腺癌细胞的增殖有无促进作用。 材料与方法:将615近交系小鼠随机分为三组(EPO组、CBP组和对照组),第1天向小鼠腹
“在文学作品井喷的今天,创作题材的同质化现象亦愈加凸显,许多的写作者都在艰辛又充满乐趣的创作路上,渴望找到属于自己、适合自己、独具特色、富有个性的作品而无法抵达。王昆
报纸
偏微分方程大致可分为椭圆型、双曲型、抛物型三大类。本文对偏微分方程中的两类方程(组)解性质进行了研究。本文在第二章研究了双曲方程中特殊情形一非齐次波动方程,给出了其Ca
改革开放以后,伴随着我国经济的高速增长,我国水泥行业也迅猛发展。近年来,随着我国经济发展进入“新常态”,经济下行压力增大,水泥行业的产能过剩问题突出,与此同时,环保督
本文以煤田地质中的烧变岩为工程背景,选取砂岩进行了岩石的高温加热实验,研究了25-1300℃温度区间对砂岩的色度、波速影响变化。同时测试了试样的抗压强度、抗拉强度以及声发射数据,分析温度对试样强度的影响以及压力作用下砂岩内部裂隙的发育。此外,本文应用热分析的手段,通过空气和氩气这两种不同的热分析环境,对砂岩内部不同温度作用下的矿物成分变化以及物理化学反应做了研究,并从宏-微观响应角度对岩石的物理特
<正> 学习任何一首钢琴作品,在教学上都不应该让学生忽视以下几方面:了解作品创作的时代背景、学习曲式结构、把握好速度与节奏、力度、声音、触键、踏板等要素,以加深对作品
联合收割机广泛采用的往复式切割器由于动刀惯性力造成振动大,工作效率低,连续回转式切割器可以很好解决这一问题。本文以齿形链式连续回转切割器为研究对象,研究其工作性能