并行数据仓库PARAWARE系统的多维数据管理技术

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:faycbl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文论述我们自行研究开发的一个并行数据仓库系统PARAWARE的核心技术--多维数据的存储、查询和维护的理论研究和系统实现.该文共分四个部分.第一部分介绍了数据仓库和联机分析技术的产生与发展,介绍PARAWARE系统研制的背景和它的整体系统结构,给出了该文的研究内容和创新点该文第二部分主要介绍PARAWARE的多维数据存储和索引策略.常用的多维数据存储方式有两种:关系表方式(ROLAP)或多维数组方式(MOLAP).ROLAP在数据的存储容量、适应性上占有优势,但其数据存取较MOLAP复杂.MOLAP存储效率高、访问速度快.但是,它存在着数据稀疏和各个维访问速度不对称两个致命问题.PARAWARE系统采用了将ROLAP和MOLAP两种存储方式相结合的混合存储模式,借助于一种分层编码的bitmap索引充分利用了二者的优点、克服了它们的缺点,在节约存储空间的同时,提高了查询的效率.该文的第三部分介绍PARAWARE的查询处理和优化子系统.根据数据仓库中数据的多维线性特点,PARAWARE采用微软定义的多维表达式(MDX)作为系统的查询语言.第四部分介绍PARAWARE的增量维护子系统.主要针对语义存储结构,借助传统的Galois格理论,捕捉了不同类型等价类的特征并提出了确切的维护策略.针对分布型和代数型聚集函数,提出了两种有效的增量维护算法,一种是单元组增加的方法,另一种是批量增加的方法.针对整体型聚集函数,提出了一种滑动窗口技术,该技术和Addset语义存储结构相结合,有效地缩减了维护整体型聚集函数所需要的运行时间.
其他文献
该文在综述Web数据挖掘的分类、研究内容和目前的研究现状的基础上,明确了Web用户访问日志数据挖掘研究的难点在于:如何对原始日志数据进行预处理,其中包括如何确定用户事务,
Web图形交互应用是一类有着众多共性的软件应用领域,随着网络应用技术的不断发展,其应用范围也不断扩大,目前已经渗透到计算机应用的许多领域.为了总结Web图形交互应用领域先
二十世纪九十年代出现的分布式对象技术,为网络软件的开发提供了强有力的解决方案。分布式对象技术是将面向对象技术与网络通信技术有机结合而发展形成的,主要是指在网络计算平
随着通信技术的迅速发展,Internet网络用途的扩大,网络规模也随之加大.大规模的网络要求高性能的互连设备,因此网络设备的性能问题越来越为广大网络建设者所重视.为了公正,客
面向对象分析是面向对象软件工程的一个组成部分.它通过类和对象模拟现实世界的实体属性及其行为的分析,发现现实世界系统的层次结构.面向对象分析方法还揭示了可以通过对象/
该文设计的异构数据库查询系统的体系结构是使用联邦数据库和数据仓库以外的第三种方法:中间件技术,在各种异构数据源和相应的接口上建立了一种新的数据模型,可以利用该模型
本论文研究数据挖掘的典型理论和一些急待研究、发展的课题,并将研究重点放在非频繁关联规则挖掘上。 简单的说,数据挖掘是从大量数据中提取或挖掘知识。 数据挖掘是计算