论文部分内容阅读
为了适应当前海量数据的存储和计算,面向上层应用提供统一的数据服务接口,邮政储蓄银行江苏省分行基于开源平台Hadoop,通过优化ETL加载过程,建立元数据,完善外部系统支持和安全管理等构建具有数据层、业务层、平台层、展现层的历史数据集中管理平台。本文简述了技术的实现方案,并介绍了数据分析和挖掘在行业中的应用。