企业环境中高性能数据仓库DW2.0架构的设计与实现

被引量 : 0次 | 上传用户:TSNT1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在企业中,经过若干年信息化工作后,企业中保留了大量历史数据。在第一代数据仓库建立后,企业已经可以利用存在的历史数据来做事务性数据的分析工作。但随着数据生产成本的不断降低,人类生产数据的数量正在飞速增加,整个社会正处在数字大爆炸的时代,从而使企业的生存环境发生了巨大的变化。对于企业而言,如何去适应这种变化已经变为能否在行业中保持领先的决定性因素之一。第一代数据仓库已显现出非结构化数据处理、容量、经济性等问题,不能再满足企业对数据存储与分析的需求。本文的主要目的是在第一代数据仓库的基础上,通过引进第二代数据仓库(DW2.0)架构,并结合当前流行的并行处理计算技术,来实现第二代数据仓库的应用。论文介绍了实现第二代数据仓库的技术背景,设计了数据仓库平台的总体架构,详细描述了数据仓库平台中各个组成部件并进行了总体设计,实现了第二代数据仓库中的三个关键技术。它们分别是:1)并行数据处理技术实现,包括硬件组成与数据库软件的使用,并行数据处理的实现使企业能在成本有限增加的前提下,实现对大数据量和高性能存储与分析的需求;2)对非结构化数据存储与分析的技术实现,使企业能够对占企业数据量60%的非结构化或半结构化数据进行分析,帮助企业利用所有企业中的数据并获取价值;3)根据数据仓库中数据的使用概率和访问模式,将数据分为交互区、整合区、近线区与归档区四个区域进行数据生命周期管理,用以提高数据仓库的性能。论文将以实例的方式来说明第二代数据仓库将如何有效支持企业战略决策工具BSC(平衡计分卡)系统的运行。BSC系统是帮助企业化战略为行动的管理体系。BSC项目的主要作用是将企业的战略目标划分为财务、客户、内部流程、学习与成长四个基本方面,由BSC战略地图将以上四个基本目标划分为互为因果的具体指标,通过对指标的高质量执行与评估来提高企业的管理水平。第二代数据仓库的实施将为BSC系统提供全面的数据支持,这些数据不仅包括来自企业ERP系统的结构化数据也包括企业在运行过程中产生的非结构化数据。将结构化数据与非结构化数据进行综合分析后,可以揭示出企业在运行管理过程中被忽略的重要信息,帮助企业获得更加精确有效的BSC指标评分,有利于企业不断改进企业流程与管理方法,从而提升企业的核心竞争力。
其他文献
长期以来,民事判决、裁定执行难、执行乱问题,成为社会广泛关注的一个司法痼疾,使司法权威受到损害,公民、法人和其他组织的合法权益得不到应有的保护。为解决这一问题,有关
随着半导体照明光源光效的不断提升和成本的不断下降,半导体照明的应用越来越广泛,对半导体照明灯具的调光和智能控制也成为一个热门的研究课题。与传统照明灯具相比,发光二极管
研究苦瓜水溶性膳食纤维(Water-soluble dietary fiber,SDF)的降血糖功效。试验腹腔注射四氧嘧啶制备糖尿病小鼠模型,设置SDF 3个剂量组、模型对照组和阳性药物对照组,通过测
电子信息时代,建设核心系统的灾难备份系统,是企业提高服务质量的重要措施之一。已经有越来越多的企业意识到灾难备份系统的重要性,开始启动灾难备份系统的建设。本文主要论述了
随着中医传统疗法和养生文化的发展,更多国际中医师、养生爱好者、汉学家期望深入理解中医,急需高质量的中医译本。中医典籍《黄帝内经》具有丰富的医学、哲学、文学、文献学
微博作为网络发展中的新鲜产物,一面世就吸引了人们的注意。青年学生作为新新人类,对微博这一信息产物更是有着浓厚的兴趣并积极投入到这个自媒体空间。微博丰富了大学生的学习
骨骼作为人体重要器官发挥着不可或缺的作用,与此同时骨疾病也成为人类面临的重大疾病之一,近年来细菌感染导致的炎症性骨疾病发生率逐渐增长,但是其治疗仍然是难点。口腔中常见
在化石能源日益枯竭的今天,太阳能光伏发电作为一种可再生的发电形式受到越来越多的重视。太阳能辐射的随机性和波动性,导致了光伏发电系统输出的不可控,这成为影响光伏渗透率提
学术不端行为严重污染了学术环境,导致社会良知、道德底线受到严重损害。学术不端造成的恶性竞争和学术资源的不合理配置,严重挫伤诚实学者的科研积极性,导致中国学术原创能力的
战略性新兴产业是新技术和新需求的产物,其发展不可避免地要面临市场、投融资等风险,因此在其发展过程中,政府有必要也必须通过各种政策来引导社会资源对产业进行扶持、对资