论文部分内容阅读
数据密集型的科学与工程应用(如计算力学数值模拟、气象预测)需要在广域、分布式的计算环境中快速安全的传输海量的数据。因此在如何网格环境中高效、可靠、安全的传输海量文件是网格计算中的一个关键性研究课题。 本文所构建的网格环境下基于多数据源的数据传输工具MFTP是MASSIVE(Multidisciplinary Applications-Oriented Simulation and Visualization Environment)网格平台的重要组成部分。MASSIVE旨在构建面向多学科应用的模拟与可视化网格环境。MASSIVE网格平台处于工程应用与网格中间件之间,为用户提供一个图形化的网格应用集成开发环境,它建立在Globus Toolkit中间件之上并支持基于网格的计算流体力学与计算固体力学问题求解及可视化。 本文所论述的MFTP利用网格环境下存在的多个数据备份Replica,提出了一种基于Replica级别的并行传输方法以提高数据传输的性能。它的流程如下:用户输入一个逻辑文件名,MFTP调用网格的复制定位服务(Replica Location Service,RLS)获得文件所在的实际的物理存储地址(physical locations);MFTP利用GridFTP提供的安全认证,部分文件传输,并行传输开始与用户选定的Replica进行安全认证并创建一个或多个数据通道,按照Replica负载量算法决定各个Replica的数据传输量大小传输数据块;最后MFTP根据各个数据块的偏移地址重新合并文件。MFTP在提高数据传输性能的同时,应用了GridFTP所具有的GSI(Grid Security Infrastructure)及Kerberos安全认证机制,因此它同时具备了GridFTP所具有的安全性能。实验表明,MFTP具有较好的数据传输性能和安全性能。