论文部分内容阅读
作为解决大规模计算问题的重要手段,高性能计算机被越来越广泛地应用到科学与工程的各个领域。随着高性能计算技术的发展,高性能并行计算机的规模不断扩大,对系统性能的要求也不断提高。当前,提高大规模并行计算机的性能主要从两个方面着手:单个计算结点性能的提高以及连接各计算结点的高速互连网络的优化与改进。随着并行计算机规模的不断增大,需要在更多的计算结点之间实现高效的互连,这对其内部的高速互连网络提出了更高的要求。如何设计大规模并行计算机内部的高带宽、高吞吐率、低延时的互连网络,提高结点互连的效率和性能,已成为高性能计算机体系结构研究领域中亟待解决的重点和难点问题。在高速数据传输环境下,以铜导线为传输介质的的电互连网络存在带宽低,功耗高,抗干扰能力差,互连密度小等不足,成为制约并行互连网络性能进一步提高的瓶颈。光互连技术作为一种新的互连方式,具有带宽高、功耗低、延时小、抗干扰等许多电互连不可比拟的优点,成为并行计算机高速互连网络的研究热点之一。但是,在当前技术条件下,由于无法有效地实现光信号的缓存和逻辑处理,在一般的光互连系统中,需要在网络中间结点上将到达的光信号转换为电信号再进行路由判断和缓存,这势必引入额外的传输延时。本文以降低光互连的额外开销,提高互连网络的实际性能为目标,针对当前光互连技术遇到的障碍,研究了高性能计算机内部无缓存的高速光互连网络技术,提出了一种不需要在中间结点进行光电转换的无缓存的光互连网络结构BOIN(Bufferless Optical Interconnection Network),研究了其路由算法及其容错技术,同时对BOIN网络的性能进行了建模分析和优化设计。论文的主要研究成果包括以下几个方面:1、针对当前光互连网络中无法进行有效的光缓存以及直接逻辑判断的不足,提出了一种不需要在中间结点上将光信号转换为电信号并进行缓存排队和路由选择的BOIN光互连结构。在BOIN网络中,光数据报文始终在光链路上传输,其在中间结点上的路由判断与选择由与其同步传输的电控制报文实现,从而避免了对光信号进行光电转换。在文中研究了BOIN网络的链路协议及端口冲突解决技术,提出了无死锁/无活锁的路由算法,证明了路由算法的可达性,指出采用该路由算法,BOIN网络中的任何报文都必定在有限的时间内由源结点传输到目的结点,并给出了这个由网络规模所决定的传输延时上限。2、为了准确地刻画和评价BOIN网络的性能,本文运用数学工具,分析了网络在各个方向链路上的流量特征,并为其建立了数学模型,得到了BOIN网络在规模和负载一定的情况下,其报文传输平均延时和平均吞吐率等性能指标的解析表达式。同时根据理论分析结果,给出了在一定的网络总规模下网络性能达到最优时其拓扑结构应该满足的条件。模拟结果显示,该模型正确反映了BOIN网络的性能特征,为网络的优化设计提供了分析依据。3、BOIN网络是为了实现高性能计算机内部的高速互连而设计的一种光电互连网络结构,因此如何采取有效的方法,切实提高其互连性能,是本文的研究重点之一。文中着重研究了BOIN网络的性能优化技术,包括避免结点饿死的路由算法,以及具有高吞吐率和高链路利用率的BOIN2网络结构。采用BOIN2网络结构,在只需要增加少许硬件资源的条件下,可以获得明显的性能增长。文中研究了BOIN2网络的路由算法,证明了其与标准BOIN网络相类似,同样具有无死锁/无活锁以及有限传输延时上限等性质。模拟结果表明这些性能优化技术能够有效地提升BOIN互连网络的性能,为大规模并行计算机的设计打下良好的基础。4、在大规模并行互连网络中,容错性能的高低是对网络整体性能进行评价的重要指标。在本文中,针对大规模BOIN网络中可能存在的结点失效问题,提出了一种FT-BOIN容错光互连网络结构,分析了在FT-BOIN网络中结点间的可达关系及其性质,给出了两个结点间存在可达路径的充要条件,并根据该条件研究了几种具有不同容错性能和复杂度的容错路由算法。实验结果表明FT-BOIN网络具有良好的容错能力,当网络中发生结点失效时,能够在可达结点之间实现无阻塞的路由。本文面向高性能计算机内部计算结点间的高速互连,对无缓存的BOIN光互连网络进行了全面的研究,在其拓扑结构、链路协议、路由算法以及性能模型等方面都进行了深入的探索,并且根据性能模型对BOIN网络进行了优化设计,同时还对BOIN网络中的容错路由技术进行了研究。上述研究成果对高性能计算机内部互连网络中遇到的实际问题给出了有效的解决方案,对并行计算机系统结构和互连网络的设计具有一定的理论意义和应用价值。