多维数据的存储机制研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:xiaoliang668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对MOLAP目前面临的分析数据量大、数据稀疏度高、维度多、要求增量更新等问题,开展了多维数据存储机制和基于多维数组的Data Cube计算方法等方面的研究及其相应实现.主要的研究内容和成果如下:●针对大数据量分析要求和具体操作系统的限制,利用文件拼接、数据分块、有效压缩等方法,建立了一个层次化的动态存储体系.●针对大数据量Data Cube的快速检索和增量加载的需求,提出并实现了ChunkIndex-BTree索引机制.●在现有Data Cube计算方法的基础上,针对大数据量、复杂高维的特点,给出了改进的Data Cube计算方法,实现了Data Cube的高效计算.●设计并实现了基于MOLAP的多维数据管理的原型系统MagicBase.在上述方法研究的基础上,设计并实现了一个多维数据管理的原型系统MagicBase,实验表明系统具有良好的性能.
其他文献
随着社会发展,电子商务正成为现代商务的主流,而政府作为社会主要信息的收集和发布者,如果其信息化应用水平跟不上企业和社会上信息发展的步伐,信息化应用水平跟不上企业和社会信
现在的软件系统对软件质量的要求越来越高.如何提高软件质量有两个关键因素:过程质量的控制和软件产品本身的质量.在传统的软件测试中,比如V模型,人们只对软件产品本身进行测
软件维护占据了软件产品的很大一部分成本,以往的研究显示软件维护消耗了70%左右的软件开发成本。随着现代软件工程的发展,软件缺陷(bugs)是不可避免的产物。修复软件缺陷是软件
90年代初期是客户/服务器模式的鼎盛时期,大多数金融、电信企业采用这种技术,组建企业内部网,这种架构分为客户机、服务器两个层次,其主要特点是:客户端:提供用户操作界面,接
随着电子商务的发展,电子商务系统所包含的商品信息越来越多,给电子商务系统的用户带来了所谓的“信息过载”问题,即用户需要过滤掉越来越多的无关内容才能找到自己感兴趣的商品
该文撰写的背景是中国科学院“十五”重大科研项目--科学数据库及其信息系统.该文的主要研究成果包括(1)综合的考察并分析了科学数据库对元数据标准的需求,为科学数据库中如何
该文对数据挖掘中的分类和聚类方面的技术进行了初步的探讨和研究,对部分算法进行了实现和改进.其中,分类采用的核心方法是二叉的决策树归纳,一个重要的设计原则是对较大的数
该文提出了对移动代理系统安全性的要求,论述了目前已提出来的保护代理平台和保护移动代理的技术,分析比较了这些技术的优缺点和实用性.该文从分析代理平台对移动代理攻击的
通过对文章中关联词的分析,针对关联词的各种逻辑关系,按照一定层次分析出文章的层次结构关系.通过与已有的语义分析模型相结合,完成文摘模型的建立.对其进行参数优化以后,利
对等计算(P2P:Peer to Peer)近来在文件共享的实现方面得到了广泛的应用.该文提出和引入几个使基于P2P的文件共享系统性能得到有效改进的新技术,并且实现了一个应用这些技术的P