论文部分内容阅读
随着计算能力向数据中心的集中,消除数据通信性能瓶颈和改进系统管理变得比以往更加重要,I/O子系统是造成这类问题的关键。如何高效的进行数据传输与处理已经成为集群互连技术的研究热点,InfiniBand正是被认为能消除当前I/O架构性能瓶颈的一种新的I/O互连技术。InfiniBand的子网可以实现从十几个到几百个节点间的高速互连与数据传输,不仅成为高性能计算领域互连的标准,而且也是存储网络的发展趋势。子网管理是实现基于InfiniBand互连的基础,主要实现拓扑的发现、路由计算和转发表的分发等功能,是InfiniBand研究的关键。本文对子网管理的关键技术进行深入的分析与研究,并基于OpenSM实现了InfiniBand的子网管理。论文的主要工作和贡献包括:(1)分析了子网管理的工作流程,研究了子网管理器的状态转换机制。基于子网管理的拓扑发现机制,给出了子网拓扑发现的探测流程。重点研究了不规则子网的Up/Down路由算法及其改进。根据InfiniBand交换机转发表的特点,研究了转发表的分发机制。提出了一种基于GUID标识的InfiniBand交换机识别方法。(2)研究了InfiniBand子网管理器的处理流程,建立了子网管理的对象模型,实现了子网管理器的扫描功能。研究了LID的分配机制,分析了LID矩阵模型的构造过程,并且根据LID矩阵模型建立了交换机的转发表。介绍了基于开放源码的子网管理软件OpenSM的子网管理器实现。(3)基于Mellanox公司的MTS3600 InfiniBand交换机和ConnectX IB HCA卡建立了一个Infiniband子网环境,对基于OpenSM的子网管理器的实现进行了测试。测试了36条子网管理命令,涵盖了拓扑发现、路由计算、LID的分配等子网管理功能,并对实验结果进行分析。综上,本文研究了InfiniBand子网管理的工作原理及其实现机制,并在构建的测试平台上进行了验证,对构建基于InfiniBand的集群系统具有一定的指导意义和应用价值。