论文部分内容阅读
为了将分布在不同地点的计算机资源共享起来,便于利用空闲的CPU或存储空间等资源出现了网格和网格计算的概念。人们希望能够就像用电一样,方便地访问网格平台上的各种资源如计算资源、存储资源、科学仪器等。由于网格平台上的不同计算机节点是分散的,当网格提供计算服务时所需要的输入数据或输出数据不一定在同一节点,这就要求需要有相适应的数据传输协议和数据传输软件来支持以,做相应的处理。在网格环境下有不同的存储系统。这些不同的存储系统根据特定的要求存储和访问大数据集而建立。这些存储系统专注于不同的需求,并为它们的客户提供不同的服务。有的系统侧重考虑高性能的访问,所以使用并行数据访问和通过不同的服务器提供带状数据访问,以提高性能。有的系统专注于支持大容量的数据访问则可以使用数据集复制本地缓冲分流和平衡服务器负载满足这些要求的数据协议需要支持高速数据传输:要支持广泛接受的协议和广域网络上的数据,传输同时要能处理突发数据量、大数据量情况:部分数据的传输用户和应用经常需要数据集中的一部分数据而不是整个数据集。例如一个文件中的一段数据因此支持这种类型的数据传输方式。第三方数据传输:许多应用需要用到多个资源必须提供一种机制允许一个地点的用户和应用能够启动监视和控制其他两个地点存储系统的数据传输为应用使用多个地点的资源提供保障:可靠、可重启、断点续传。在广域网环境下,数据传输故障和服务器故障经常发生,导致传输中断。需要支持数据传输的错误恢复机制,提供传输过程中的检错和纠错功能,还需要保证数据传输的安全性。本文着重研究基于网格平台的分布式存储器数据存储机制,数据传输机制,模型以及实现方法,包括数据节点的数据分布机制、数据服务的运作机制、数据传输机制等。论述了网格服务所实现的功能以及实现的原理。本文还论述了如何用符合WSRF规范的网格服务的形式访问数据服务器与SOA架构相结合,展望并提出一些有待增强的方面