数据仓库中实体化视图一致性维护方法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:strongstrongqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球经济的发展,分布式数据库应用日益广泛,许多数据被自然地分布在不同位置上。如,一个公司很可能在世界范围内设有分公司,每个分公司都有自己的数据库。因此,数据仓库技术变得越来越重要。通常,一个企业的信息系统是逐步建立起来的,往往是先建立一些孤立的数据库,而支持这些数据库的计算机系统和DBMS可能互不相同;也就是说,它们是分布的、自治的、甚至是异构的。数据仓库把这些来自分布的、自治的、甚至是异构的数据源信息集成在一起,为决策支持提供单个、一致的数据存储。 通常,数据仓库中存储了大量实体化视图,这些视图中的数据用于领导层进行决策分析。由于数据仓库中的数据大都是从操作数据库中提取出来的,因而,数据仓库中的数据应该定期(如,每周或每月一次)刷新,与数据源中数据保持一致。在维护中,若视图v中的数据来自多个数据源,就会涉及到表的连接。连接操作在数据仓库的维护中占有重要地位,其算法好坏直接影响到视图维护的效率。假设视图中的数据来源于n个表R1,R2,…Rn,由于JOIN操作运算量大,若采用对R1,R2,…Rn重新作JOIN的方法来更新视图V,显然要浪费大量时间,因为重新作JOIN的结果包括实体化视图V。由于我们仅对变化的数据感兴趣,因此可以采用增量的JOIN算法。即,只要将涉及变化数据的JOIN结果追加至视图V中即可。 本文研究视图的增量维护算法,提出一种新的分布连接算法(增量的JOIN算法)。与已有的算法相比,我们的算法易于实现,并具有很好的I/O性能。 本文主要完成以下几个方面的工作: 1 对数据仓库维护中所面临的主要问题进行了深入分析。 2 采用增量视图维护策略,并提出一种新的分布连接算法,对其正确性给出证明。 3 与已有的增量视图维护算法进行分析和对比,新算法具有很好的I/O性能。
其他文献
视频分析是计算机视觉领域中重要方向,从非结构性的视频数据中提取语义信息也是人工智能领域的突破。场景、事件是构成视频语义的重要组成部分,前者反映了视频中的相对固定的“
人脸识别技术是模式识别领域中一个非常活跃的研究课题,它在经济、法律上有着广阔的应用前景.特征抽取是模式识别中的关键问题之一,线性鉴别分析(LDA)是一种有效的特征提取方法
数据库中的知识发现(KDD)主要是研究如何自动地和智能地从海量的数据中提取出有用的知识和信息,它是目前相当活跃的一个研究领域。概念格模型作为一种用于数据分析的形式化的
地理信息系统(Geographic Information System,简称GIS)是以空间数据为基础,在计算机硬件的支持下,对空间相关数据进行采集、管理、操作、分析、模拟和显示,采用地理模型分析方法
人脸是人类表达情感的重要载体,具有丰富的生物信息。人脸识别、人脸跟踪和表情识别技术广泛应用于身份认证、视频监控和人机交互等应用领域。人脸检测技术是人脸识别、人脸跟
在对各种传统的Unix/Linux检查点算法进行分析和分类评述的基础上,采用基于PVM的交错的非阻塞一致性并行检查点算法,在Linux工作站群环境下实现了一个可应用于PVM的并行检查
该文首先从工控组态软件的分析和设计方法着手,提出了基于可复用构件的工控组态软件的设计思想,并分析了可复用构件及其开发和组装方法,重点研究COM/DCOM技术.为了增强通用性
本文以为大连市计划生育委员会开发研制育龄妇女管理信息系统中所遇到的实际情况为背景,结合了分布式数据库的相关理论、计算机网络技术和三层次结构计算模型,根据实际需要设计
当今网络迅速发展,网络的规模不断扩大,网络系统中设备的多样化以及各种设备功能和运行情况的差异,使得网络管理越来越复杂。设计一个好的网络管理软件进行对网络的管理是十分必
本文系统地讨论了计算机网络安全防范的基本原理、方法以及网络安全的研究现况。分析了黑客入侵网络的常用手段,指出网络被入侵的根本原因在于系统安全漏洞的存在。 针对漏