论文部分内容阅读
正如金融是现代经济的核心,银行则是现代金融体系的主体一样,信息化是现代社会的发展趋势,而数据则是信息化的载体。随着金融市场全球经济一体化趋势的不断加快,对银行业的发展和管理提出了更高的要求。银行信息技术应用的重点,正逐步从传统业务向电子化、数据管理集中化、管理决策信息化等方向发展。银行是一个高收益伴随着高风险的行业,在日常的运营过程中无时无刻不面临着各类风险,如何把控风险是银行必须面对和解决的问题。风险管理不是事态发生后的补救,而是一种主动预知事前行为,以避免事态发生的预报措施。商业银行目前拥有大量的客户群,在长期的业务活动中积累了海量数据,合理应用这些数据,可及时发现有价值的数据,防范潜在的风险,提高数据的最大利用率。本文以笔者所在的公司与某商业银行联合开发的风险控制系统为研究对象,以该银行已有的CRM数据仓库抽取与风险相关的业务数据,构建风险数据集市,在此基础上,分别进行了信用风险多维分析和信用风险分类。用数据挖掘技术,挖掘出隐含的风险,为银行预测未来可能发生的风险提供科学依据。主要工作如下:1)提出了商业银行风险控制系统的整体架构的设计方案。通过分析商业银行的业务需求,对系统的功能模块进行了划分,其功能主要有数据预处理、信用风险多维分析、风险加权计算。根据系统功能,提出了风险控制系统的层次结构,主要分数据源层、数据准备层、分析处理层和前端应用层。根据数据处理的流程,数据可分为风险数据集市、数据接口、数据加工处理和报表展示。2)信用风险数据的多维分析。采用Teradata Administrator工具,使用SQL语句,将相关风险数据抽取到临时表,对主题进行拆分,形成多个维度表,构建多维分析模型。以客户、行业、资产负债为主题,从多个维度对贷款客户进行分析,了解贷款客户违约发生的潜在风险。3)信用风险分类。研究如何构建基于CART算法的决策树,建立信用分类模型。分析贷款人的还款意愿和还款能力,为银行发现优质客户和潜在风险客户提供依据。风险控制系统目前运行稳定,根据银行需求不断开发新报表,定期向报表模块推送,提供银行可视化查询分析功能。