论文部分内容阅读
近年来,网格技术尤其是数据网格快速发展,为网格环境带来了大量的数据。网格数据以共享为主要目的,有着海量、异构以及分布性的特点,传统的数据管理模式无法很好的解决这些日益突出的问题,而人的精力是有限的,如何来管理和更好的应用这些异构数据正成为数据网格同时也是基础数据管理所面临的主要问题之一。数据空间(dataspace)技术是应对新的数据管理挑战,在2005年由M.Franklin等人通过描述一个数据空间的支持平台引入了一种新的信息管理概念。通过对数据进行抽象,将各种数据抽象为数据空间中的实体;同时围绕这些实体,提供一系列中高层服务,包括目录、检索、实体发现及总体上的管理;并且通过动态的实体关系增加来达到类似数据集成的目的。在理论上证明数据空间能够有效的解决数据管理需求带来的新问题。结合数据管理和数据网格的研究现状,通过对网格技术发展现状进行深入研究,在网格基础中间件GLOBUS的网格环境上,提出以数据空间来管理网格数据的总体架构。本文分析了网格环境下数据管理的现有成果,以OGSA-DAI为实现基础,并根据该网格数据访问集成中间件的特性,利用工作流和资源服务机制,设计和实现了一个网格数据管理系统简单原型。具体研究工作包括以下几个方面:论述了网格数据集成的研究意义,介绍了网格、网格数据访问技术和中间件的研究现状。总结了数据空间的研究现状,分析数据空间中数据抽取、检索和集成方面的相关技术。设计了网格数据空间管理系统,对其各组成部分的实现进行了详细的分析和设计。在网格基础软件Globus Tookit 4.0构建的网格环境上,实现了基于OGSA-DAI的网格数据空间管理系统GDSMS的原型,实现异构网格数据管理。为数据空间的进一步研究打下基础。