网格环境下数据库代数操作算法的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a9228144
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网格技术是一种新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为人们提供更多的资源、功能和交互性,能够使人们透明地使用计算、存储等资源.计算网格是一种分布式计算基础设施,在动态跨组织域的虚拟组织内实现协同的资源共享和问题求解.数据网格是一种分布式数据管理体系结构,为分布在网格中的远端资源提供了协同的管理机制,它是随着网络技术以及计算网格技术的发展而产生的一种新技术.数据网格中除了计算资源外,还包括各种类型的数据库、文件系统等数据资源,这些数据资源常常存储在不同地点,不同格式的数据载体中.数据网格则能够协同地对这些海量数据进行管理.数据库在数据网格中扮演着十分重要的角色.该文主要研究网格环境下各种海量数据库操作算法.在各种数据库操作中,连接操作是经常用到的也是最复杂的操作,该文对于参加连接的两个关系首先利用关系缩减算法进行预处理,然后采用流水线并行技术将数据传输到网格所提供的多个执行结点上按照块归并算法进行操作,得到连接结果.这样既可以减少网络通信开销,又可以增加I/O和CPU并行,从而降低响应时间.对于集合并、交、差操作以及关系的投影、选择和消除重复操作,该文的算法不同于传统的算法,传统算法首先对关系进行排序操作,然后再对有序的新关系进行各种操作.该文所描述的集合并、交、差操作算法主要思想是构造一个函数,选取一个关系具有代表性的属性字段为自变量,把它们的值通过该函数映射到整数集合上,然后对于另一个关系的每一个元组,通过同一个函数映射为一个整数值,将两个事业集合中的整数值进行比较,根据比较的结果,就可以完成集合的并、交、差操作.对于消除重复操作和投影操作,则申请一块内存空间用来保存函数的映射值,通过把下一个元组的映射值和内存中的整数值进行比较,就可以完成消除重复操作和投影操作.理论和实验结果表明,该文所研究的网格环境下海量数据库操作算法在最小化网络通信开销和最大化I/O和CPU并行方面具有很好的性能.
其他文献
该文首先具体分析了GIS系统的发展现状,讨论了目前WebGIS常规采用的体系结构,指出了其中存在的主要问题,并从解决问题的角度引出了对GML的论述,进一步探讨了GML的来源及发展
网络拥塞一直是长期困扰Internet的难题,近年来虽然人们先后提出了多种卓有成效的算法,但网络拥塞问题仍然远未曾解决,使得拥塞控制一直是网络研究领域的热点之一.在拥塞控制
我们在进行"广东工业大学继续教育学院网络管理信息系统"的项目研发过程中遇到了这样的问题:学生通过外网查询成绩,教师通过外网录入成绩到内网.在外网防火墙等防护机制都失
随着半导体制造工艺水平的快速提高和应用需求的持续增长,系统芯片集成的功能部件数量不断增加,片上通信压力相应增大,对片上互连结构设计提出了更高的要求。本文基于PKUnity86
信息技术应用的普及以及计算机网络的飞速发展导致了计算机支持的协同工作的诞生。经过近二十年的发展,CSCW的应用却处在一个颇为尴尬的境地:一方面人们对于协同技术的需求越来
高层体系结构(HLA)作为新一代分布式交互仿真协议,主要解决分布式仿真应用系统的互操作性和可重用性,从而缩短系统开发周期,减少开发成本,降低大型系统的项目风险.联邦开发执
高速缓存是弥补处理器和内存之间的性能差距的重要方式。改善数据的局部性,可以更有效地利用高速缓存,进一步提升处理器的性能。运行时刻从堆中分配的数据的布局对程序性能有很
该文在分析现有各种企业诊断方法的优缺点的基础上,面向企业的生产经营管理过程,提出了一套综合运用了传统人工企业诊断方法、基于知识企业诊断方法以及原有基于模型企业诊断
该文概述了机器人足球比赛的发展历史和研究动向,然后通过列举实例来说明全自主足球机器人发展现状及其关键技术.由哈工大计算机学院自主设计开发的HIT-Ⅱ型全自主足球机器人
溯因逻辑是从已知现象寻找最优解释的由果溯因的推理方法.在软件质量改进过程中,无论是在从过程参数到导致发现过程中存在的问题的应用中,还是在作为质量改进的重要组成部分