论文部分内容阅读
一、银行业数据挖掘的必要性与可行性分析
1.银行业应用数据挖掘的必要性分析
自20世纪90年代起,人类社会步入了信息革命的时代,在高新技术和信息产业的推动下,银行为适应庞大的机构和业务迅速增加的需要,充分利用现代科技成果,电子化程度越来越高,主要体现在:计算机的广泛应用、银行支付清算系统的更新、利用互联网技术开展网上银行服务等。电脑的广泛使用使商业银行的业务及其经营管理发生了革命性的变化。因此,银行之间的竞争就更为激烈,而且竞争的方式发生了很大的变化:竞争的优势不在于密集的商业网点,而在于是否能低成本、高效能的为每一位客户提供定制化的产品或服务;根据客户的消费偏好,来推测它未来的消费倾向,需要何种金融服务等等。另外,我国银行面临入世的压力:外资银行在信息咨询、理财顾问、零售业务等知识和技术含量高的银行业务上拥有优势。所以,内资银行在与资本雄厚、管理先进、数据集中的外资银行竞争中不可回避之处就在于有效的收集市场和客户信息,及时有效地对客户的需求做出反馈。即一方面人们要从杂乱无章的数据中找到有用的数据;另一方面,人们要解决某一问题是需要对数据进行整合应用。上述问题在现有的OLTP数据库操作模式下是无法实现的。自二十世纪八十年代后期,产生了数据仓库和数据挖掘等信息处理思想。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先所不知道的,又是潜在有用的信息和知识的过程。(1995年在加拿大蒙特利尔召开的第一届“知识发现和数据挖掘”国际学术会议上首次提出数据挖掘这个概念。)
利用数据挖掘可以使银行及时、全面、准确的掌握自己客户的各种情况,并可以根据客户为银行创造的利润多少以及创造应力的可能性对客户进行分类,是银行掌握同业经营状况和国内、国际经济发展趋势,为银行的资源配置提供最佳的方案。
2.银行业应用数据挖掘的可行性分析
银行进行数据挖掘不能盲目进行。要进行可行性分析。因为任何一个经济实体都不能忽视数据挖掘的目标是降低成本、创造利润。所以,在进行数据挖掘是首先要考虑投资收益率。按照企业实施项目是的结构化分析方法,将数据挖掘分为:准备阶段、进行数据挖掘阶段、系统测试阶段和应用实现价值阶段。因此,在考虑投资回报时就要考虑在这几个阶段的资金投入。在数据挖掘准备阶段要考虑的主要因素有:数据收集、整理的费用。因为数据挖掘处理的是大量的数据,这些数据都存在于数据库系统中,是长期的积累。此阶段所做的技术方面的工作包括数据的选择、净化(消除冗余数据)、推测(推算缺失数据)、转换(离散值、数据与连续值数据之间的相互转换,数据值的分组分类、相互项之间的计算组合等)、数据缩减(减少数据量)因此,要综合考虑上述工作所要花费的人力、物力而且要考虑原有数据的基础准备工作的质量。数据挖掘进行阶段是最关键的步骤,需要技术人员根据选取的相应算法,对数据进行分析。接下来要进行系统测试和评估。因为根据数据挖掘得到的模式或模型有些是有实际意义的,而有些是毫无价值的,所以需要用户的评估。这项评估可以根据用户多年的经验,也可以根据实际情况的验证。通常情况下,数据挖掘工作采用的是外包给专业的软件公司完成,因此,上述方面的资金投入和耗用时间长短可以参照投标公司的预算计划。第四个阶段也就是实现信息价值的阶段(既知识运用的阶段)。在此阶段可以充分利用前面经过验证所得到的实际应用模型,挖掘数据中潜藏的有价值的信息,为决策者提供有效的帮助。我们可以根据决策所带来的价值来预测数据挖掘项目的应用所带来的产出既效益。另外,由于数据挖掘既非计算机学科、也非统计学或营销学,需要应用人员具有综合技能。所以在考虑投入产出时需要考虑员工的培训费用。而一般而言,数据挖掘的时间不超过一年,所以在进行投资回报的计算时,为简化计算,可以不计资金的时间价值。我们建立如下模型来计算投资回报率:
ROI――投资回报率
Ci ――数据挖掘各阶段的投入
V――应用数据挖掘模型所带来的收益
T――培训费用
ROI=V/(∑Ci+T)
二、 数据挖掘在银行中的应用
数据挖掘可以在银行的诸多业务中发挥不可小窥的作用。如:银行投资管理、贷款管理、负债管理、中间业务、银行市场营销、风险管理、人力资源管理等方面发挥作用。但是,笔者认为,我国的银行业实施数据挖掘应该首先从风险管理开始,分步骤实施。因为风险对银行来说是与生俱来的。尤其从我国的实际情况来看,我国商业银行的利润来源有九成左右来源于存贷利息之差。利润来源的单一性更进一步加大了我国银行经营的风险。
由于银行风险的存在和发生都是不确定的,如何在不断变化的宏微观环境中识别可能给银行带来意外损益的风险因素,是银行业风险管理的前提条件。银行识别风险的传统方法主要有:财务报表分析法、风险树搜寻法、德尔菲法、筛选-监测-诊断法。在进行数据挖掘是考虑上述方法,可以根据上述方法建立模型来识别商业银行的风险,确定目前及未来经营的风险因素、判别自己所承受风险的具体形态及其性质,对风险进行识别和估计,对风险进行量化的测算。量化包括两个方面的内容:一方面是判断某一风险发生的概率;另一方面判断风险带来损失的规模。由于目前我国商业银行面临的最主要风险是信贷风险,所以有关风险管理的数据挖掘工作主要围绕信贷风险展开。通过数据挖掘实现风险预防、风险规避、风险分散、风险转移和风险抑制。
1. 风险预防
风险预防是指商业银行对风险设置多层预防线的方法。银行抵御风险的最终防线是保持充足的自有资本。再有,因为商业银行的自由资本毕竟有限,因此还要根据具体业务情况保持专项准备金、资本损失准备金、贷款坏帐准备金等以备补偿贷款本利损失。那么我们需要测算的是保持多少自由资本和准备金。因为过少的准备金和自有资本达不到防范风险的效果,而过高的准备金和自有资本又会降低资金的使用效益。所以要采用合适的方法来确定准备金和自有资本规模的大小。传统的做法是根据经验判断,给定系数,然后用贷款的规模来进行相乘的方法确定。在特定的技术条件下,我们只能采用这个办法。随着信息技术的发展,我们可以把诸多因素考虑进去,包括贷款的规模、客户的信用情况、经营情况、客户所处市场环境等等统一应用,进行数据挖掘,运用合适的方法计算出企业应该保持的自由资本和准备金。
2. 风险规避
风险规避是指风险管理者根据风险识别和风险估计的结果,选择主动放弃或拒绝实施某些可能引起风险损失的方案,即对风险明显的经营活动采取的比重就轻的处理方式。风险规避是一种最彻底的处理风险的方法,能够在风险发生之前完全消除某一特定风险可能做成的损失。但是由于风险和收益是永远成正比的,因此,应该权衡风险与利益的关系,挖掘出风险与收益相匹配的业务。
3. 风险分散
商业银行的每一笔贷款都是有风险的,但并不意味这都发生损失。风险分散的具体做法有:贷款对象的分散、贷款期限的分散、贷款利率分散、贷款参与者分散。分散方法一般有两种:随机分散和有效分散。随机分散主要是选择的对象不依赖于相关性进行合理选择。而有效分散要充分利用对象之间的相关性,减少组合贷款的总体风险。对有效分散而言,模型和资产选择是至关重要的,在此过程中可以充分运用数据挖掘的优势建立模型分散风险。
4. 风险转移
风险转移是指在贷款风险发生之前通过各种手段把可能发生的风险转移给其他人承担,从而保证商业银行贷款的安全。转移的途径主要有:向客户转移、向保证人转移和向社会保险机构转移。通常向客户转移可以采用的方法是通过对未来市场利率的预测,采用适当提高贷款利率和浮动利率的方法,把利率因素可能引起的风险转嫁给借款人。但是究竟将利率提高到什么程度可以即留住客户,又能足以转移风险,这是数据挖掘将要解决的一个问题。
5. 风险抑制
风险抑制是指商业银行承担风险后,在损失发生或发生之前,采取措施,减少风险造成的损失。常用于信用放款过程。目前,商业银行的风险抑制主要有以下方法:追加担保人和担保金额、追加贷款客户的资产抵押、贷款客户信用不好或经营状况持续恶化,就减少或不追加放款额;派驻财务专家帮助风险客户搞清财务恶化的原因,并提出解决问题的指导性意见。在此过程中需要借助数据挖掘解决的问题是:及时发现风险、及时解决问题,在追加贷款、支持借款人度过难关与放弃支持、尽快索偿贷款、尽力减少因借款人清盘而发生损失这两种措施之间做出合理的抉择。
作者单位:张泓波 南京信息工程大学张宏铭东北财经大学金桥商学院
1.银行业应用数据挖掘的必要性分析
自20世纪90年代起,人类社会步入了信息革命的时代,在高新技术和信息产业的推动下,银行为适应庞大的机构和业务迅速增加的需要,充分利用现代科技成果,电子化程度越来越高,主要体现在:计算机的广泛应用、银行支付清算系统的更新、利用互联网技术开展网上银行服务等。电脑的广泛使用使商业银行的业务及其经营管理发生了革命性的变化。因此,银行之间的竞争就更为激烈,而且竞争的方式发生了很大的变化:竞争的优势不在于密集的商业网点,而在于是否能低成本、高效能的为每一位客户提供定制化的产品或服务;根据客户的消费偏好,来推测它未来的消费倾向,需要何种金融服务等等。另外,我国银行面临入世的压力:外资银行在信息咨询、理财顾问、零售业务等知识和技术含量高的银行业务上拥有优势。所以,内资银行在与资本雄厚、管理先进、数据集中的外资银行竞争中不可回避之处就在于有效的收集市场和客户信息,及时有效地对客户的需求做出反馈。即一方面人们要从杂乱无章的数据中找到有用的数据;另一方面,人们要解决某一问题是需要对数据进行整合应用。上述问题在现有的OLTP数据库操作模式下是无法实现的。自二十世纪八十年代后期,产生了数据仓库和数据挖掘等信息处理思想。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先所不知道的,又是潜在有用的信息和知识的过程。(1995年在加拿大蒙特利尔召开的第一届“知识发现和数据挖掘”国际学术会议上首次提出数据挖掘这个概念。)
利用数据挖掘可以使银行及时、全面、准确的掌握自己客户的各种情况,并可以根据客户为银行创造的利润多少以及创造应力的可能性对客户进行分类,是银行掌握同业经营状况和国内、国际经济发展趋势,为银行的资源配置提供最佳的方案。
2.银行业应用数据挖掘的可行性分析
银行进行数据挖掘不能盲目进行。要进行可行性分析。因为任何一个经济实体都不能忽视数据挖掘的目标是降低成本、创造利润。所以,在进行数据挖掘是首先要考虑投资收益率。按照企业实施项目是的结构化分析方法,将数据挖掘分为:准备阶段、进行数据挖掘阶段、系统测试阶段和应用实现价值阶段。因此,在考虑投资回报时就要考虑在这几个阶段的资金投入。在数据挖掘准备阶段要考虑的主要因素有:数据收集、整理的费用。因为数据挖掘处理的是大量的数据,这些数据都存在于数据库系统中,是长期的积累。此阶段所做的技术方面的工作包括数据的选择、净化(消除冗余数据)、推测(推算缺失数据)、转换(离散值、数据与连续值数据之间的相互转换,数据值的分组分类、相互项之间的计算组合等)、数据缩减(减少数据量)因此,要综合考虑上述工作所要花费的人力、物力而且要考虑原有数据的基础准备工作的质量。数据挖掘进行阶段是最关键的步骤,需要技术人员根据选取的相应算法,对数据进行分析。接下来要进行系统测试和评估。因为根据数据挖掘得到的模式或模型有些是有实际意义的,而有些是毫无价值的,所以需要用户的评估。这项评估可以根据用户多年的经验,也可以根据实际情况的验证。通常情况下,数据挖掘工作采用的是外包给专业的软件公司完成,因此,上述方面的资金投入和耗用时间长短可以参照投标公司的预算计划。第四个阶段也就是实现信息价值的阶段(既知识运用的阶段)。在此阶段可以充分利用前面经过验证所得到的实际应用模型,挖掘数据中潜藏的有价值的信息,为决策者提供有效的帮助。我们可以根据决策所带来的价值来预测数据挖掘项目的应用所带来的产出既效益。另外,由于数据挖掘既非计算机学科、也非统计学或营销学,需要应用人员具有综合技能。所以在考虑投入产出时需要考虑员工的培训费用。而一般而言,数据挖掘的时间不超过一年,所以在进行投资回报的计算时,为简化计算,可以不计资金的时间价值。我们建立如下模型来计算投资回报率:
ROI――投资回报率
Ci ――数据挖掘各阶段的投入
V――应用数据挖掘模型所带来的收益
T――培训费用
ROI=V/(∑Ci+T)
二、 数据挖掘在银行中的应用
数据挖掘可以在银行的诸多业务中发挥不可小窥的作用。如:银行投资管理、贷款管理、负债管理、中间业务、银行市场营销、风险管理、人力资源管理等方面发挥作用。但是,笔者认为,我国的银行业实施数据挖掘应该首先从风险管理开始,分步骤实施。因为风险对银行来说是与生俱来的。尤其从我国的实际情况来看,我国商业银行的利润来源有九成左右来源于存贷利息之差。利润来源的单一性更进一步加大了我国银行经营的风险。
由于银行风险的存在和发生都是不确定的,如何在不断变化的宏微观环境中识别可能给银行带来意外损益的风险因素,是银行业风险管理的前提条件。银行识别风险的传统方法主要有:财务报表分析法、风险树搜寻法、德尔菲法、筛选-监测-诊断法。在进行数据挖掘是考虑上述方法,可以根据上述方法建立模型来识别商业银行的风险,确定目前及未来经营的风险因素、判别自己所承受风险的具体形态及其性质,对风险进行识别和估计,对风险进行量化的测算。量化包括两个方面的内容:一方面是判断某一风险发生的概率;另一方面判断风险带来损失的规模。由于目前我国商业银行面临的最主要风险是信贷风险,所以有关风险管理的数据挖掘工作主要围绕信贷风险展开。通过数据挖掘实现风险预防、风险规避、风险分散、风险转移和风险抑制。
1. 风险预防
风险预防是指商业银行对风险设置多层预防线的方法。银行抵御风险的最终防线是保持充足的自有资本。再有,因为商业银行的自由资本毕竟有限,因此还要根据具体业务情况保持专项准备金、资本损失准备金、贷款坏帐准备金等以备补偿贷款本利损失。那么我们需要测算的是保持多少自由资本和准备金。因为过少的准备金和自有资本达不到防范风险的效果,而过高的准备金和自有资本又会降低资金的使用效益。所以要采用合适的方法来确定准备金和自有资本规模的大小。传统的做法是根据经验判断,给定系数,然后用贷款的规模来进行相乘的方法确定。在特定的技术条件下,我们只能采用这个办法。随着信息技术的发展,我们可以把诸多因素考虑进去,包括贷款的规模、客户的信用情况、经营情况、客户所处市场环境等等统一应用,进行数据挖掘,运用合适的方法计算出企业应该保持的自由资本和准备金。
2. 风险规避
风险规避是指风险管理者根据风险识别和风险估计的结果,选择主动放弃或拒绝实施某些可能引起风险损失的方案,即对风险明显的经营活动采取的比重就轻的处理方式。风险规避是一种最彻底的处理风险的方法,能够在风险发生之前完全消除某一特定风险可能做成的损失。但是由于风险和收益是永远成正比的,因此,应该权衡风险与利益的关系,挖掘出风险与收益相匹配的业务。
3. 风险分散
商业银行的每一笔贷款都是有风险的,但并不意味这都发生损失。风险分散的具体做法有:贷款对象的分散、贷款期限的分散、贷款利率分散、贷款参与者分散。分散方法一般有两种:随机分散和有效分散。随机分散主要是选择的对象不依赖于相关性进行合理选择。而有效分散要充分利用对象之间的相关性,减少组合贷款的总体风险。对有效分散而言,模型和资产选择是至关重要的,在此过程中可以充分运用数据挖掘的优势建立模型分散风险。
4. 风险转移
风险转移是指在贷款风险发生之前通过各种手段把可能发生的风险转移给其他人承担,从而保证商业银行贷款的安全。转移的途径主要有:向客户转移、向保证人转移和向社会保险机构转移。通常向客户转移可以采用的方法是通过对未来市场利率的预测,采用适当提高贷款利率和浮动利率的方法,把利率因素可能引起的风险转嫁给借款人。但是究竟将利率提高到什么程度可以即留住客户,又能足以转移风险,这是数据挖掘将要解决的一个问题。
5. 风险抑制
风险抑制是指商业银行承担风险后,在损失发生或发生之前,采取措施,减少风险造成的损失。常用于信用放款过程。目前,商业银行的风险抑制主要有以下方法:追加担保人和担保金额、追加贷款客户的资产抵押、贷款客户信用不好或经营状况持续恶化,就减少或不追加放款额;派驻财务专家帮助风险客户搞清财务恶化的原因,并提出解决问题的指导性意见。在此过程中需要借助数据挖掘解决的问题是:及时发现风险、及时解决问题,在追加贷款、支持借款人度过难关与放弃支持、尽快索偿贷款、尽力减少因借款人清盘而发生损失这两种措施之间做出合理的抉择。
作者单位:张泓波 南京信息工程大学张宏铭东北财经大学金桥商学院