大型商业银行基于Hadoop分布式数据仓库建设初探

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:zhiqi_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商业银行的数据规模随着传统业务扩展和互联网发展水平的不断提高而与日俱增,使得银行对数据的存储、管理和应用要求越来越高。通过搭建基于Hadoop技术的大数据平台,利用分布式文件系统HDFS、SQL分析引擎Inceptor、Nosql数据库工具Hyperbase、流处理工具Stream等架构,探索了大型商业银行Hadoop分布式数据仓库的构建过程,最终实现了由基于集中式存储架构的传统关系型数据仓库向分布式数据仓库的迁移工作。该分布式数据仓库实现了结构化数据和非结构化数据的存储、ETL调度管理、历史数据检索、交互式分析以及流数据处理。应用表明,相比基于集中式存储架构的传统关系型数据仓库,分布式数据仓库可大幅提高数据存储和数据服务的效率。
其他文献
自改革开放以来,我国经济取得了快速发展。而经济发展离不开基础设施建设,其中,交通基础设施建设更是突飞猛进。如今,道路桥梁建设不仅在工艺设计技术上发生着改变,而且在施
涑水河是黄河的一级支流,孕育了中华早期文明。通过大量详尽的历史资料记载,对明清涑水河的水文特征进行复原刻画。结果表明:涑水河上宽下窄,上陡下缓,洪水集中;姚暹渠系人工
慢性肾功能衰竭是由于各种慢性肾脏疾病晚期肾功能减退引起的综合征。赵老师阐明其病理性质为正虚邪实;病位以脾肾为主,常累及它脏。提出临证贵在把握疾病不同阶段的病机特点,明
目的:脂肪肝(Fatty liver disease,FLD)发病率日渐升高,对多种重大疾病影响颇深,因此,开展FLD的中医药治疗是我们努力的方向之一。本研究者观察脂肝方对FLD脾虚痰湿型患者的
角度测量是技术测量中的一个组成部分,每个零部件的加工、装配和安装都会遇到各种角度测量问题。随着生产和科学技术的发展,对产品和零部件角度测量应用越来越广泛,对精度要
本文采用纸张作为超滤复合膜的基膜,并选用合适的成膜材料,采用表面涂覆工艺制备纸质超滤复合膜。实验研究了不同打浆度纸张的最大孔径,孔隙率,纯水通过量和对牛血清蛋白的截
在全面贯彻落实科学发展观,建设社会主义和谐社会的时代背景下,依法管理宗教事务需要不断地发展和完善,以适应宗教和谐、社会和谐的要求。经过几十年的努力,我国宗教事务管理
人类对物体识别存在着整体布局加上与特征侦察(或称局部特征识别)两种加工方式,对不同种类物体识别时的加工方式是否一样,何种因素对物体识别加工方式选择起着决定性作用等问
中国现代企业的管理理论在改革开放不断深化的进程中不断进化,从全盘接受西方管理科学,到如今结合中国文化及中国管理思想的精华,形成了企业文化管理中国化这一必然趋势,中国
<正>华北地块南缘罗圈组被多数学者认为是冰碛成因或冰水混成成因的杂砾岩地层,并认为可与分布于华北地块边缘及其周边的小型或微地块上的其他杂砾岩地层相对比。但因缺乏可