论文部分内容阅读
在当今高性能计算领域中集群以其成本低,通用化占着重要的地位。然而随着对于高性能计算需求的提升,集群系统的CPU个数从几十个逐渐发展到了成千上万个,集群系统中的高速互联网络成为集群性能提高和发展的瓶颈。
RapidlO作为一个新生的开放标准,由于其传输速度可高达60Gbps,并且具有低延迟,支持3D torus等多种网络拓扑结构,非常适用于大规模高性能计算集群中。但是目前RapidIO用于集群中还没有专用接口。MPI程序必需通过TCP/IP协议,使用以太网模拟器,才能使用RapidIO网络,严重影响了RapidIO网络的性能。
本文通过对RapidIO用于高性能计算集群的分析,尤其是现有接口的缺点分析,设计并且实现了基于RapidIO的高性能通信接口。本文的主要贡献如下:
1) 分析了现有软件对于RapidIO用于高性能计算集群的缺点。包括RapidIO底层驱动与以太网模拟器的缺点,MPI通过TCP/IP协议使用RapidIO的缺点。
2) 设计并且实现了基于RapidIO的高性能通信接口。该接口具有基于优先级的多流,利用RapidIO硬件完成错误校验等特性。并且通过优化RapidIO底层驱动以及使用动态空闲缓存池提高了该接口的性能。通过利用RapidIO硬件可靠传输的特性以及维护RapidIO网络中各个节点的信息,该接口在避免建立连接开销的同时做到了可靠,有序的传输。
3) 建立了实验平台,对延迟、带宽、CPU占用率、内存拷贝性能进行了测试与分析。并且通过实验分析,优化了内存拷贝函数,使得带宽进一步得到提高。实验结果表明:基于RapidIO的高性能通信接口较以太网模拟器在延迟、带宽、CPU占用率上都有较大优势。