PAROⅡ物理设计及数据装载

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liner1018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对物理划分中的一维数据划分方法的研究,提出改进的R-H以及Multiple-Way-Hash一维划分方法,并且在自主研制的并行数据库系统原型PAROⅡ中予以实现.R-H划分方法有利于数据划分均衡、小区域查询以及精确匹配查询;Multiple-Way-Hash划分方法可从多个哈希函数中选取一个较为合适的哈希函数进行实际的数据划分,降低了数据偏斜.并行索引结构是进行物理设计时要考虑的另一个重要问题.在并行索引结构研究的基础之上,提出并在PAROⅡ中实现了并行RDB-树的索引结构.RDB-树提高了系统的空间利用率,降低了网络传输的费用.PAROⅡ中的并行数据装载器PDL具备数据输入划分、数据以集存储的功能.在PDL中,传递划分数据的消息结构的数据域长度比一般SQL语句消息结构的数据域长度长得多,数据域中的元组是以紧凑的方式进行存放,并且同一处理结点利用多线索能同时进行划分和存储,节省了批量装载时间.使用PDL接口能够控制多种装载方式:从控制结点、从处理结点以及从控制结点和处理结点同时进行装载.PDL利用Multiple-Way-Hash划分方法较好地解决了数据倾斜的问题.实验数据表明并行PDL具有较好装载效果以及优化性能.
其他文献
该文首先介绍了数据仓库、OLAP和数据挖掘的基础理论,然后研究了OLAM的一般模型,提出一种OLAM的实现,最后,介绍了OLAM技术在财务分析系统中的应用.该课题研究的第一个成果是
目前在数字图书馆领域存在两个难点问题:异构信息仓储的互操作;缺乏搜索有用信息的信息过滤方法.因此设计了基于多层代理的数字图书馆模型MADL,模型完全由多个独立自治的代理
该文首先在第一、二章对现有的各种IBR(Image-based Rendering)基于图像的绘制技术进行了简单介绍和分类比较,主要包括几何表示形式的IBR,图像表示形式IBR以及全视函数表示形式
Peer-to-Peer是近年来国际上研究得比较热门的一个题目.它不仅掀起了一场前所未有的资源共享热,而且冲击了当前Internet环境下Client/Server模式.该片论文讨论了Peer-to-Peer
角色动画是计算机三维动画的一种,它描述一个或多个角色的运动过程。近年来,计算机软硬件能力的不断提升以及计算机图形、图像处理技术的不断发展完善很大程度上推动了角色动画
该文提出了一个树型的基于∑邻接矩阵全文索引、中文文本逻辑结构与内容的文本对象数据库模型及其创建算法,建立了相应的SQL查询机制.针对中文文本文件的句子中常包含有一些
该文主要是对搜索引擎的查询质量进行研究.为了解决信息检索,特别是搜索引擎的查询质量问题,作者提出了一个查询的四层模型.在第二部分中,提出了四层模型.在四层模型中,综合
CMM只提供了一种思想,一个框架.如何基于这个规范来建立一个适用于自己的软件开发过程质量保障体系是目前比较关注的问题.该文基于国内中小型软件企业现状,以中兴公司南京研
作为智能网与业务设计者之间的接口,业务生成环境SCE目前采用SIB作为可重用模块,在多个业务设计中重用,很好地实现了业务无关性.但由于其复杂的参数设置要求业务设计者具有丰
该文首先介绍了半结构化数据的基本概念和相关的存储及查询技术,然后介绍路径表达式计算方法的研究进展,并提出了一种最新的路径匹配方案--利用文档结构的位置信息进行路径匹