论文部分内容阅读
近年来,随着网格技术的发展,越来越多的网格应用需要处理海量数据。由于网格环境所固有的异构、分布、动态、自治等特性,这些海量数据相应也具有异构、分布特征,给网格应用的处理带来了极大不便。因此,在网格环境下,要实现对海量数据进行有效管理,就必须引入专门的数据管理软件——网格数据库管理系统(Grid-DBMS)以减轻网格应用处理海量数据负担。目前,还没有出现严格意义上的网格数据库管理系统。因此,对网格数据库管理系统的研究是网格领域一个新的研究方向。Grid-DBMS是数据库技术在网格环境下的拓展,其目的是屏蔽数据资源异构、分布等特征,提供一个全局逻辑视图,以最快的速度响应网格应用对数据资源的需求。为此,Grid-DBMS必须实现数据资源的命名透明性、定位透明性、协议透明性、时间透明性和异构透明性;同时,Grid-DBMS也应该能够根据系统运行时的状态信息,自动、透明、动态地对数据资源进行重新配置,以给网格应用提供一个高效强健、智能透明和统一标准的网格数据库访问接口。元数据管理机制在Grid-DBMS系统中处于重要地位,是实现数据资源透明性的关键。Grid-DBMS要给网格应用提供一个全局逻辑视图,必须要有元数据管理机制的支持。元数据管理机制采用分层的分布式结构模型提供元数据管理和数据源定位服务。为了提高Grid-DBMS的响应时间,在元数据管理机制中引入数据副本管理,以记录数据源副本信息,维护数据源副本一致性。同时,由于网格环境的动态性,要求元数据管理机制具有可扩展性,以便在系统运行过程中及时注册新的数据源以及删除系统已有数据源。数据源的定位是基于分层的分布式结构模型,并在此基础上结合日志管理的最近最少用(Least Recently Used, LRU)置换算法提出一种数据源定位策略。这一策略也考虑到了诸如用户对数据源访问权限等元数据管理的其它方面,以满足Grid-DBMS系统对元数据管理机制的要求。