论文部分内容阅读
随着我国金融产业的繁荣发展,商业机构的规模不断壮大,银行产业所接触的数据也不断增多。国外商业银行的需求和理念不断推动着我国银行在数据处理方式上的转型与创新,银行数据处理已迈入融合数据集成、数据仓库和数据挖掘等先进技术的新阶段。本文首先分析了目前银行运营过程中所面临的数据源众多、业务类型多样、分析方法缺失等技术难题,在总结国内外相关研究和实践成果的基础上,借鉴上述数据处理技术的成功经验,以国内某知名商业银行为背景,从实际业务出发,设计并实现了一款融合数据集成、数据存储、数据分析与数据展示的银行数据综合处理平台,研究工作如下:1.设计实现了一套数据集成方案,提供对银行各类异构数据源的集成。在研究数据集成方案的过程中,本文针对银行机构存在多种数据源的特点,设计为每个独立数据源均配备一个独立的包装器,各类数据被提取到各自的包装器内,然后通过指定的转换算法,将不同格式的数据转换为统一的XML Schema,并生成XML文件。该方案实现对银行多源数据的提取与转换,有效地解决了银行异构数据集成的问题。2.设计构建了一套基于银行业务的数据仓库架构,实现了银行数据的分类存储。在研究数据存储方案的过程中,本文采用数据仓库的存储架构,并结合该银行运营过程中实际开展的不同业务,将本系统的数据仓库架构划分为数据仓库和数据集市两个部分。数据仓库按照银行业务采用主题模型进行构建,划分了十类主题。数据集市根据数据的实际应用需求,分别采用了业务建模和星型模型的方式进行设计。采用这种架构有效地解决了银行数据的分类存储问题。3.设计采用了不同的数据统计方法和关联分析算法,实现了银行业务的多维分析和关联分析。通过对数据的累加、类比、分类和整合等数据统计方法,实现对银行核心业务、渠道业务及理财产品等业务的多维分析。同时,还采用了优化的Apriori算法,实现了客户与银行理财产品的关联分析。以上方法的使用,有效地实现了银行业务运营情况的分析,为银行业务的未来发展提供了良好地决策支持。4.基于上述工作设计并实现了一套银行数据综合处理平台,该系统提供对银行数据的统一集成、分类存储、多维分析与关联分析,并采用了Flex技术实现了数据展现功能。最后,使用测试工具对系统进行了Web页面测试和性能测试,验证了系统的可靠性与稳定性。该系统的使用,有效地解决了银行多源数据的统一整合,各类业务数据的分类管理,以及业务运营情况的分析等问题,起到了增进业务发展、提供决策支持的重要作用。