论文部分内容阅读
商业银行(CommercialBank)是银行的一种类型,也是中国金融体系的重要组成部分,在中国经济运行和社会发展中发挥着重要的作用。近年来,我国商业银行贷款业务存在的问题较多,其中不良贷款率的上升趋势严重影响着我国银行业金融机构的稳定。同时对社会经济发展产生不良影响,因此建立有效的不良贷款识别方法对我国社会经济稳定发展有重要的现实意义。本文基于机器学习方法对商业银行不良贷款数据的识别问题进行了系统的研究。根据由人工标识类别的商业银行贷款数据库样本,提出了基于机器学习的商业银行不良贷款的识别模型,为商业银行识别不良贷款、降低信贷风险提供一种有效的审计工具。 首先,从定性角度分析梳理了基于机器学习的商业银行不良贷款的识别与预防管理的相关理论方法。在对商业银行贷款质量、商业银行不良贷款进行了界定与分类基础上,从商业银行不良贷款的行业、信息质量和数据三方面提出贷款数据的特征进行分析和刻画方法,通过对批发零售、制造、建筑等13个行业的商业银行不良贷款业务状况进行分析研究,分析了这些行业不良贷款的识别特征;接下来对于识别不良贷款的机器学习原理与方法进行了系统的分析与介绍,分析了机器学习在金融数据挖据方面的应用,及其在不良贷款识别上的应用特点,为后续研究奠定理论基础。 其次,构建了商业银行不良贷款识别的指标体系,建立了基于PCA-RELIEF的我国商业银行贷款数据的特征选择模型。首先,在原始的商业银行贷款数据样本的众多特征定性分析基础上,采用PCA-RELIEF算法构建的特征选择模型,提取对识别不良贷款规律最有效的特征,降低了特征空间维数,并进行商业银行贷款类别分类的特征选择,以提高模型研究不良贷款识别的概率。 再次,在不良贷款数据特征提取基础上,构建基于机器学习的商业银行不良贷款的多分类器识别模型。首先,利用决策树和朴素贝叶斯分类方法构建基于人工标记数据的不良贷款检测的基本分类模型,并且对这两种基分类器的准确率进行了对比分析,揭示了优良贷款与不良贷款样本数量上的差异会导致分类精度差的问题,即类不平衡问题;其次,分析研究各种基分类器特性并且对比分析分类效果差异性,挑选具有较好分类性能的基分类器子集,引入多分类器融合技术和大间隔理论研究最优融合策略,建立了基于多分类器融合算法的商业银行不良贷款数据检测的智能识别方法。并以哈尔滨某商业银行对公贷款作为研究对象进行实证分析,验证模型的有效性。 最后,以黑龙江省某商业银行的贷款企业的财务数据与银行贷款数据进行不良贷款识别的实证研究。包括数据解析、特征提取、指标体系构建和识别模型的设计,证明了本文提出的商业银行不良贷款识别方法能为银行贷款风险等级分类真实性审计提供有效的工具;同时,基于实证分析结果,从审计、银行经营和宏观环境三个方面提出了相应的管理建议。