论文部分内容阅读
数据网格着眼于如何在一个动态的、多单位参与的虚拟组织内实现数据资源共享与协同工作,而对分布式的、异构的海量数据资源的共享与访问是现代大部分科研工作不可或缺的一部分,因此,数据网格与科研工作的关系非常密切。
本文的研究工作是以中国科学院十五信息化建设重大项目“科学数据库及其应用”(项目编号:INF105-SDB)和中国高技术研究发展计划“高性能计算机及其核心软件”重大专项支持的科学数据网格(项目编号:2002AA104240)为背景进行的。科学数据库经过近二十多年的发展,数据资源的规模和深度不断扩展,如何将来自多个分布组织松散耦合的数据资源和研究人员联合起来,实现资源共享并进行有效的协同工作,成为科学数据库研究人员面临的重大挑战。
本文提出了基于Web服务资源框架(Web Service Resource Framework,WSRF)的数据访问服务系统,来解决对科学数据库中分布式、异构的数据资源的共享与协同调用问题。WSRF根据特定的消息交换和相关的XML模式来定义给定的Web服务资源,定义了有状态资源的Web服务访问模式,并阐明了如何将“状态”和Web服务结合的一簇Web服务约定;WSRF对Web服务通用性的增强与扩展,在服务功能上更有普遍性。数据访问服务旨在以网格服务的形式在网格环境和互联网上快速发布数据,实现对科学数据库中分布式、异构的数据资源的有效共享。本系统按照功能分为服务实例、服务信息注册、服务实例的生命周期管理和异常信息管理等四个模块。服务实例模块采用虚拟数据库同物理数据库映射的方式来屏蔽底层数据库的异构性,以统一的方式向外发布异构数据库的元数据信息和数据信息;通过数据访问服务来发布数据,使得分布式、异构的数据库更好的具有了数据共享和协同调用的能力。服务注册模块注重同科学数据网格信息服务——IMS网格信息与元数据服务的协同工作,采用主动注册和被动查询的方式来保证信息服务中心的服务数据的有效性。服务实例生命周期参照WS-ResourceLifetime来设计了系统的服务实例生命周期管理机制,从生命周期管理角度增强了系统的性能。异常信息管理模块从系统的Java实现和Web服务信息交换两个方面来设计异常信息的管理机制,使得系统的异常信息得到了有效的管理,同时对于系统的性能和易用性也提供了有效的保障。