基于Bagging算法的集成支持向量机在个人信用评级中的应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:liushuaimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用在经济生活中有着十分重要的地位,随着中国经济的发展,居民承担金融风险的能力增强,个人消费信贷进入了一个蓬勃发展的时期,信用即是金钱的时代已经到来.另一方面,由于中国庞大的人口基数,中国消费者的信用数据也在以爆炸式的方式增长,运用统计方法并结合在许多领域发挥重要作用的数据挖掘技术进行个人信用评级的前提已经成熟.在信用评级领域,传统的定量分析方法不仅效率十分低下,而且很多情况下依赖评级者的主观判断,信用记分卡模型的引入有效改变了这一状况,信用申请者的特征得到量化,进而使得一系列的客观标准建立起来,信用评级的客观性和效率大大提高.但信用评级问题依然存在很多困难,申请者是否会违约,不仅仅取决于还款能力,还会受到还款意愿的影响,而还款意愿往往无法量化,这导致了在进行信用评级时普遍存在错误率较大的问题.支持向量机(SVM)是在上世纪九十年代由Vapnic提出的一种机器学习方法,它以统计学习理论为基础,不仅具有优秀的小样本学习能力,而且在解决非线性、高维度、过拟合等机器学习上的传统难题方面效果显著.集成学习则通过一定的算法训练产生多个具有差异性的子学习器,并通过特定的方式将子学习器的决策进行合成,以做出最终决策.集成学习提高了学习器的泛化能力,往往可以取得比单一学习器更好的结果.本文选用台湾信用数据,首先以较早出现的判别分析方法和Logistics模型与支持向量机方法进行实证比较,就总体正确率而言,径向基核函数支持向量机正确率最高,判别分析法正确率最低,但判别分析法的错误主要是将信用好的样本误分为信用差的样本,这说明判别分析法在实际应用中依然有一定的价值.接着本文尝试采用21折抽样和随机抽样的方法对径向基核函数支持向量机进行集成学习,取得了一定的改进,但是我们的改进十分有限.一直以来,信用评级问题都是分类问题中的难题,要想找到理想的方法依然有很长的路要走。
其他文献
甘薯叶及嫩芽富含营养成分,其蛋白质、脂肪、糖分、磷、铁等的含量,均居于蔬菜前列。在维生素中,以胡萝卜素的含量最高,是一般蔬菜无法比拟的.所含的VB<sub>2</sub>、Vpp.均
人们常说,少食可以减肥。而美国莫特耐克先生经过周密调查后却认为.吃得越少.越容易长胖。尽管一个人节食后暂时会瘦一些.比如每天摄取的热量从2,500卡减少到2.000卡.但人体
1988年,我厂为强化质量管理,从改革分配制度入手,推行了以质量否决为主要内容的一等品质量工资制,把工资与奖金捆在一起,按生产的产品质量优劣进行分配,调动了职工的生产积极
攀枝花钢铁(集团)公司从战略上高度重视节能环保工作,特别是近年来,攀钢坚持以科学发展观为指导,认真贯彻落实党中央和国务院关于节能减排的重大战略决策,注重资源开发与保护并举,积
目的探讨早发型重度子痫前期的临床诊治对母婴的影响。方法将2011年1月至2012年12月入住我院诊断为早发型重度子痫前期的58例患者按孕周分为三组,观察并分析三组患者的母婴结
鸡年岁末的粮价暴涨风经各级政府和粮食部门的共同努力现已平息。有人说,此次涨价风来势之猛,涨幅之高,波及范围之广,对各方面的影响之大,实为改革开放以来所少见。以浙东平
党的十一届三中全会以后,我市农村普遍实行了家庭联产承包责任制。由于家庭经营地位的确立,充分地调动了农民的生产积极性,劳动生产率和土地产出率都有了很大的提高。同时,产
随着2008年铁矿石价格谈判尘埃落定,全球钢铁企业与巴西矿石年度合同协议价格同比上涨65%。这是继2004年我国正式参加铁矿石谈判以来连续第5年的上涨。铁矿石成本在钢铁企业生
一、钢铁工业的可持续发展1.我国钢铁工业实现可持续发展战略研究。2.金融危机影响下钢铁业的未来发展前景和趋势分析。3.转变发展方式,提高发展质量和效益,促进科学发展的战略研
洪山乡蒋岙村地处余姚市南端的四明山麓,是个人多地少,资源贫乏,地理条件差的山岙村。近几年来,该村从实际出发,大力发展村办工业,全村经济迅速发展,成为远近闻名的"汽配之乡