非均衡数据分类算法及其在助学贷款风险管理中的应用研究

被引量 : 0次 | 上传用户:zstzst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非均衡数据集的分类是数据挖掘的任务之一,通常传统分类方法应用于非均衡数据集会带来少数类分类精度的下降等问题,而非均衡数据集的预处理和分类器的优化可以较好地提高少数类的分类精度。国家助学贷款的违约风险管理涉及到非均衡数据集的分类问题,有效预防和控制违约风险的发生始终是这个领域关注的重点。本文围绕非均衡数据集分类问题及其在助学贷款风险分类中的应用做了如下工作:对分类问题的研究现状进行了综述。重点分析非均衡数据集分类所面临的困境及当前国内外在这一领域研究的主要方向,同时对比了国内外非均衡分类技术在学生贷款风险管理分类及个人信用评估中的主要差异。指出我国在学生贷款信用风险管理定量研究方面的不足和制约因素。围绕非均衡数据集分类的两个主要研究方向:数据集的预处理和分类算法的优化开展了研究工作。分析了SMOTE重取样技术的特点和不足之处,受封装式属性选择思想的启发,提出了基于封装式的少数类重取样技术(Wrapper Synthetic Minority Over-sampling Technique, Wrapper-SMOTE)来解决非均衡数据集的分类问题,通过UCI数据集的实验验证,该数据预处理方法与SMOTE方法相比进一步提高了少数类分类的效率。改进了标准粒子群算法,提出基于遗传选择策略的粒子群算法(Genetic Selection Strategy Particle Swarm Optimization, GSSPSO)。利用粒子群的寻优特性,用改进的粒子群来优化支持向量机分类器的参数。重点把支持向量机的损失参数C和权重参数Weight作为一个二维的粒子K(c,w),用GSSPSO进行优化并找到最佳适应值,促使支持向量机优化模型尽快找到面向非均衡数据不同类别错分代价的合理权重,使得分类超平面尽可能偏向于少数类。实验证明优化过的分类器提高了分类模型对少数类样本数据的拟合程度,使分类的精度得到提高。探索了我国助学贷款违约风险管理的定量研究方法。以武汉地区10所不同类别的高校2001年至2008年贷款学生的57836个数据为样本,这些数据覆盖从高职高专学生到研究生、涉及106个专业。分别把基于封装式的少数类重取样算法和改进粒子群优化支持向量机的分类模型这两种定量方法用应于国家助学贷款违约风险分类,实验结果证明这两种方法提高了分类效率。论文的研究成果可有效帮助高校和银行加强其对可能违约贷款学生的信用评价和跟踪管理,从而降低银行助学贷款违约率;同时,研究成果也有助于促进我国学生助学贷款政策的健康和可持续发展。
其他文献
1变中求稳从全国高考理综卷(Ⅰ)的整卷结构来看,2006年和2005年完全一致。生物、化学、物理各学科试题的数量及赋分也都一样:生物5道选择题,2道非选择题,共72分;化学8道选择题,4道非
<正>深度学习产生新算法深度学习是基于机器学习延伸出来的一个新的领域。由以人大脑结构为启发的神经网络算法为起源,加之模型结构深度的增加发展,并伴随大数据和计算能力的
豫西地区刘家沟组中下部发育多层砾岩,其中扁平砾石与球形砾石共生,扁平砾多顺层排列,球形砾常具圈层结构。因该砾岩层发育普遍,特征明显,成为刘家沟组的区域划分对比标志之
<正>石油化工是国家重点支持发展的支柱产业。其系列生产装置的深度研制、设计、开发、利用以及产品的生产、消费和拥有的总量,标志着国家现代化建设水平。在经济全球化的新
亚健康状态与中医"心"的功能活动密切相关,亚健康常表现为心悸、胸闷、气短、神疲、烦躁、失眠等一系列心系症状,或伴有心律失常、血压值介于正常与高血压之间,这种心系亚健
<正>据柬埔寨拜林省农业局的数据,今年该省木薯价格上涨,由于天气原因,产量有所下降。该省种植面积达3.70万hm2,其中木薯种植面积达80%,平均产量为30 t/hm2。5月1日,拜林省农
选择位于江汉平原的JZ-2010湖相沉积剖面为研究对象,利用AMS14C测年建立江汉平原12.76 cal.ka B.P.以来环境演变的时间序列。对湖相沉积物中元素Rb和Sr的差异分布、Rb/Sr值、
利用-OH和-NCO的亲核加成反应,直接合成出端硅氧烷基聚己内酯/聚硅氧烷(PCL-TESi/PDMS-TESi),利用合成出的PCL-TESi/PDMS-TESi对环氧树脂(EP)进行复合改性,通过溶胶.凝胶技术及胺
<正>从1965年到1975年,前往台湾的苏联"秘使"至少有6人,有的多次到台湾。其中最为典型的就是以《伦敦晚报》记者身份为掩护,化名为"维克托·路易斯"的苏联特务维塔利·叶夫根
十九世纪英国和俄国先后完成工业革命,为了争夺原料产地、商品销售市场和争夺世界霸权,先后在世界各地发生激烈的冲突与摩擦。此时位于西亚的伊朗成为两国争夺的重要地区之一