论文部分内容阅读
以消费信贷为主要功能的信用卡已经成为十分普遍的个人理财工具,信用卡成为银行业的重要收入来源。信用卡己经成为发达国家和地区的商业银行体现银行品牌和市场形象、发展个人客户和增加业务收入的重要金融产品。未来几年,我国的信用卡发卡量仍将保持高速增长。高收益的信用卡业务必定伴随着高风险,国内信用卡发卡商正面临着前所未有的严峻挑战。信用卡发卡商是否具有平衡风险与收益的能力是其成败与否的关键。如何扭亏为盈,避免中国信用卡市场走向整体长期亏损,战略转移已刻不容缓。研究信用卡信用风险管理,对推动信用卡产业良性发展、保持国民经济持续稳定发展;避免金融机构和个人损失;增加金融机构的利润都有十分重要的意义。本文主要研究申请受理与审批和客户关系维护与管理阶段的模型。申请受理与审批阶段,本文引入了基于支持向量机的信用评分模型,首先对不同的核函数的性能进行对比,引入了新的核函数以提高性能,并提出了混合支持向量机信用评分模型;对信用评分领域的拒绝推断问题,把两种数据挖掘技术相结合提出了拒绝推断模型。客户关系维护与管理阶段提出了行为模型,金融机构可以依据评分结果决定客户的新的信用额度、是否派发新的信贷产品等;同样基于客户的消费行为数据,建立信用欺诈检测模型,可以有效的防止金融机构和客户的经济损失。支持向量机方法是数据挖掘中的新方法,可以有效地解决分类和回归问题。支持向量机方法解决分类和回归问题时,面临的主要问题有三个:①选择最优输入特征;②选择核函数;③确定核函数的参数。本文首先对一些常用的核函数进行了数值实验,并引入了KMOD、ERBF核函数建立了支持向量机信用评分模型;随后提出了混合支持向量机信用评分模型,在输入特征选取上,利用分类回归树(Classification and Regression Tree,CART)和多元自适应样条回归(Multivariate adaptive regression splines,MARS)进行特征选择;对于参数确定,采用格点搜索法确定最优参数;对建立的信用评分模型,用真实数据进行了实证研究。在构建信用评分模型过程中,样本数据一般是那些申请被接受、还款行为被观测到的数据,导致样本数据的非随机性,这就是信用评分中的拒绝推断。这种样本数据在应用时导致参数估计偏误,建立的评分模型预测时产生的偏差称为拒绝偏差。本文提出了一个拒绝推断的混合数据挖掘方法,该方法结合了k-均值聚类和支持向量机分类两种数据挖掘手段。在聚类阶段,信用卡数据被聚成同质的类,申请尚未批准的申请人按照其所在的类分配类标签;在分类阶段,基于聚类阶段产生的样本,采用支持向量机进行训练,得到分类器;最后,计算变量的重要性。由于个人信用的动态变化、银行评分目的的转变,有必要对客户的行为进行信用评分。贷方可以依据行为评分结果决定客户的信用额、是否派送新产品以及客户账户情况欠佳时如何挽回损失。本文把自组织神经网络和多类支持向量机相结合,提出了SOM-MSVM行为评分模型。通过对客户以往的行为进行分析,把他们聚成类,每一类有类似的行为和得分;对每个类赋予类标签,构造分类器,预测他们的信用分值,贷方可以根据这个分值进行决策。基于这种考虑,提出了两阶段的混合支持向量机行为评分法,首先用自组织神经网络对客户的消费行为数据进行聚类,然后构建了多类支持向量机分类器对客户行为评分。由于每年全球信用欺诈案件和造成的损失的急剧增长,本文对信用欺诈的概念、信用欺诈的主要方式和欺诈的预防进行了探讨,对欺诈检测模型进行了归纳和评价,最后提出基于支持向量机的欺诈检测模型,并对有监督的标准支持向量机和无监督的一类支持向量机进行了对比试验。