论文部分内容阅读
自90年代以来,并行计算得以空前的飞速发展,并行系统的体系结构趋于成熟,数据传输网络的标准化和传输速率的大幅提升,为研制并行系统创造了有利条件。集群系统近些年逐渐成为并行计算实现载体的主流。随着计算结点性能的不断提高,集群系统的通信系统已成为影响并行计算性能的一个重要因素。为了满足集群对性能、可靠性和可维护性等的要求,就要提高通信系统的性能。但是新型高速网络通常价格昂贵,而传统的低效网络因不能满足高性能通信需要而得不到有效利用,有必要引入并行的思想将已有的通信资源充分利用起来。多通道通信技术就是利用多条网络通信链路进行通信,提高集群系统的通信性能和可靠性。本文是辽宁省科学技术基金博士启动项目:并行系统高性能多通道通信技术的研究(20051058)的重要组成部分,围绕着并行系统的通信系统展开研究工作,主要内容包括:1.分析了通信系统的主要构成和当今用于集群系统流行的通信硬件。同时介绍了并行计算编程工具MPI的基本理论,阐述了通信系统对于并行计算的重要性。2.根据MPICH-1.2.5和Linux-2.4.32内核代码具体分析了MPICH整个通信过程的三个层次:应用层、内核层、网络设备层。从MPICH的收发函数开始,到内核中的套接字和TCP协议的实现过程,最后到网络设备接口将数据在主机和网络之间传输。并从三个方面阐述了通信系统对并行计算性能提高的重要性,同时给出了提高通信性能的途径。3.在现有的实验环境基础上,本文提出了基于bonding技术的优化最轻负载选择法(optimization lightest load selection arithmetic)。此算法可根据网卡当前的负载状态,建立网卡负载索引,缩短查找最轻负载网卡的时间,实现了动态选择通信通道,整个系统的性能得到了优化。最后使用MPBench测试工具对广播通信、带宽和回路延迟进行了测试,结果证明本文算法与单通道通信和原bonding技术相比,三方面性能都有所提高。