类别不平衡数据的个人信用风险评估算法研究

来源 :河北大学 | 被引量 : 3次 | 上传用户:fgjfg111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术催生了一大批新兴产业,促使互联网金融业蓬勃发展,不论是京东白条、蚂蚁花呗还是P2P网贷,越来越多的信用消费产品走入人们的生活。众多互联网信贷产品在为用户提供便捷可靠的服务之前,需要先依据用户的基本信息、历史交易数据来构建个人信用风险评估模型以预测可能发生的违约风险。使用机器学习算法构建个人信用风险评估模型是解决这一实际问题的常用方法。信贷数据通常是类别不平衡的,传统的机器学习算法在面向不平衡数据的分类问题时,通常易将少数类样本误分为多数类,导致预测结果不理想。然而在现实问题中,对少数类样本进行准确地识别往往是更为重要的。面对不平衡数据,如何有效的对其进行分类有着重要的研究价值。与此同时,信贷数据还具有维度高、冗余特征较多的特点,如何对数据进行有效的特征选择,使得选出的特征子集在包含最多数据信息量、最少噪声特征的同时,可以最大程度提升模型泛化能力、节省模型训练时间。基于此背景,本文以提高不平衡的信贷数据中少数类样本的识别率为研究目标,提出了一种改进的数据过采样方法和一种改进的特征选择方法,用于处理高维不平衡的信贷数据,通过改进的深度森林算法建立个人信用风险评估模型,具体研究内容如下:(1)使用数据过采样方法降低数据倾斜度。针对不平衡的信贷数据同时包含分类特征和连续特征的特点,提出了一种基于HVDM距离的改进ADASYN数据过采样方法,提高过采样过程中生成新样本的效率与合理性。(2)提出一种基于最小冗余-最大相关思想的特征选择算法,以单特征AUC值作为特征重要性的衡量标准,并进行排序,通过计算特征间Kendell相关系数,选出信息量高且冗余特征较少的特征子集。(3)基于国内外不平衡信贷数据,使用深度森林算法gcForest构建个人信用风险评估模型。通过对深度森林中的级联结构进行改进,结合XGBoost算法丰富级联层原有的基分类器类别,进一步强化整个森林对少数类样本的识别能力,最终构建针对不平衡信贷数据的个人信用风险评估模型。
其他文献
随着知识在产品和服务的价值增值中起着越来越重要的作用,知识已成为生产力和经济增长的驱动力。企业逐渐认识到知识这种关键生产要素的巨大作用,开始把知识管理作为企业管理
军队的射击训练方式主要为打靶训练,而现有的靶机存在移动不灵活、运动方向单一的问题,因此设计了一款移动灵敏的智能靶车,可以极大提高战士打靶的射击水平。目前该智能靶车
随着信息技术迅速发展,智能化在各个领域中的重要性也日益突显出来。我校通过研究和实践,研发出智能电子黑板系统,并逐步面向市场加以推广。智能电子黑板的出现,因其具有型笔书写、板擦擦除、绘图和电子资源展示等一系列功能受到各类学校的青睐。然而,在前期的调研过程中我们发现,电子黑板在激活过程中存在着一些问题。原有的电子黑板系统的激活方式为线下激活,即通过线下使用激活工具对电子黑板进行激活。该激活方式的缺点在
随着钻地武器向着高速、深侵彻方向的发展,弹内装药的安定性在一定程度上制约着炸药的合理应用,而装药内部应力是评估炸药安全性能的一个重要判据。在高过载恶劣环境条件下,
随着数字图像相关技术的高速发展,数字图像的应用领域愈加广泛,数字图像修复技术也愈加活跃以来,对于一些老旧照片的折痕和污点的去除,影视作品中的后期处理,摄影作品中的多余物剔除等多种领域都有着很实际的应用。同时,由于采用计算机进行修复处理,图像的修复过程可以在保持原貌的基础上多次反复进行,直至取得最满意的修复结果。所以图像修复技术的研究具有着很重要的实际意义。本文首先分析了图像本身所具有的形状结构特征
随着科技的进步,数字图像与我们的社会联系已经密不可分。从报纸、杂志到科学、医学领域的期刊都严重依赖数字图像。然而伴随许多强大的图像处理工具的出现(如Photoshop),数字图像的可信度也逐渐降低。只需对数字图像进行简单操作(如拼接、背景渲染、区域复制等)就可以使图像的内容和意义在毫无察觉中改变。近年来,一些人为了混淆视听达到损人利己的目的,在新闻报道、学术研究以及法庭证据等方面对真实图像进行了肆
由于密封端面粗糙度在尺度上与密封间隙大小很接近,对间隙液膜流动特性和密封性能的影响已不可忽视。针对动压型机械密封端面粗糙度影响的研究,存在密封端面表面粗糙度模拟难
广东省某纺织集团采用液氨丝光整理替代传统的液碱丝光整理,经过液氨丝光整理后织物的手感、光泽以及亮度都得到了很大的提升。但液氨丝光整理的过程中使用了大量的液氨,在进
土壤重金属污染是当下环境领域的热点问题,土壤中各生物及非生物组分影响和控制着重金属在土壤中的形态分布和迁移活动,探究多种土壤组分影响下重金属的环境行为对了解重金属
在当今社会,审计对于经济的健康有序发展起着重要的监督作用,审计质量的状况也是影响国计民生的重要问题之一,同时,伴随着市场和法律的不断完善,企业对于审计需求的质量越来越高。特别是在“互联网+”以及区块链的大背景下,审计被赋予了新的含义,不仅要从传统的财务报表中获得相关的财务信息,还要从大数据中提取对审计有用的数据信息,对审计的要求有了大幅度的提升,也让我们对审计有了更加全新的认识。为了降低高管的机会