基于不平衡数据的银行破产分类算法研究

被引量 : 0次 | 上传用户:yuwumalan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
银行的破产特别是大银行的破产有可能导致银行系统危机的出现。由于银行危机会给一国的经济发展带来巨大的损失,甚至导致金融危机,如2008年的雷曼兄弟倒闭所引起的链锁反应;为此,加强对商业银行的监管,特别地妥善处理面临破产的银行,及早采取措施,发出预警,甚至提早关闭面临破产的商业银行,对保障金融秩序,维护经济稳定十分重要。正常的经济环境下,大部分银行都是健康的,只有小部分是有问题即将面临破产的,也就是说银行破产问题是两分类问题,即分为健康的银行和即将面临破产的银行两种。而有问题的银行通常都会在财务数据上有所反映,因此,本文所研究的银行破产问题就是针对财务数据而进行的。而另一方面,健康银行数量远大于面临破产银行,这其实就是一个不平衡分类问题,因此,本次研究的对象就是基于不平衡数据集的银行财务数据破产分类。本文所研究数据为美国芝加哥联邦储备银行(Federal Reserve Bank of Chicago)数据集,均可在网站下载。该数据集包括了大量银行的财务数据,属性量高达数千。直接对这些属性值进行机器学习效率低下,本文的研究主要基于一些财务比率。为了更好的对银行机构进行破产预测,数据挖掘技术因此被引进并对银行财务数据进行挖掘。通过标准化财务数据为机器学习的标准形式,然后进行机器学习和预测测试,以此分析该数据挖掘技术的性能。由于不平衡分类问题的特殊性,目前国内外对此类问题的研究主要集中在以下两个方面:数据处理方法和算法改进方法。数据处理的方法着重于让数据变得平衡,然后再进行机器学习,算法改进的方法通过改变不同类的错分权重来实现。为了能提高银行数据的少数类分类性能,本文分别应用了随机过抽样,随机欠抽样,SMOTE与SVM的结合方法,另一方面,将代价敏感引入SVM,在算法层面和SVM进行结合,以寻求代价最小的分类算法。最后对银行数据进行学习预测,分析比较得出这几种分类算法中最有效的方法。
其他文献
实验动画短片以其强烈的艺术表现力与独特的探索创新性成为了动画艺术史上不可忽视的重要组成部分。随着动画创意产业的高速发展,动画影片对商业价值的强烈追求成为了主流的
将生活污染水按洗衣水、洗漱水、厨房水、冲厕水分类收集,并测定其主要污染指标,经人工湿地净化72h后,再测定与处理前相对应的污染指标,结果发现,洗衣水、洗漱水、厨房水均能
近年来,“三农问题”一直是我国改革的焦点问题,生鲜蔬菜又在我国农业生产中占有重要地位,既是消费者日常生活中不可或缺的食物,又是农民收入的重要来源之一。生鲜蔬菜的高效
沙盘游戏技术是现在国际上影响广泛的心理治疗技术之一,这些年来,沙盘游戏技术在国内也有所发展,相关研究已取得一些成果。国内学者已经将其应用到自考生焦虑、大学生人际交往不
政府和社会资本合作(Public Private Partnership,简称PPP)在我国大力推行,是生产力发展到一定阶段对生产关系的适应性调整,是政府与市场的优势结合。改革开放以来,我国产权
资本主义社会的基本矛盾是生产的社会化和生产资料的私人占有的矛盾。这一矛盾在社会经济关系上首先表现为每个企业中生产的组织性和整个社会生产的无政府状态之 The basic
在经济全球化和信息化条件下,当今世界企业呈现出不可遏止的国际化趋势,跨国经营已成为世界经济的主导经营形式。一个国家拥有国际化经营公司的数量和规模,代表着该国的经济
随着我国经济社会的快速发展以及城市化进程加快,社会人口流动性很大。尤其是在城乡二元格局、户籍制度分隔城乡社会群体的背景下,我国人口流动数量大、流动程度剧烈,越来越
近年来,随着环保要求的不断提高,油墨印刷行业已逐步进入技术转型的新阶段,低效率、高能耗、高污染的传统印刷工艺面临着逐步淘汰的趋势。然而,新兴的模内装饰技术(In-mould decor
在分析青海门源县某金矿区域水文地质概况的基础上,查明了矿区水文地质特征及岩层富水特征,总结了矿床充水因素。研究表明:矿区水文地质勘探类型属于第一类第一亚类,以孔隙裂