论文部分内容阅读
近年来,对于高性能计算多计算机系统起到了越来越重要的作用。在多计算机系统互连网络中,如果处理器或传递信息的线路发生故障,将导致信息传递失败。如何提高互连网络的可靠性,使网络发生故障时,仍能有效地传送信息,即建立一个有效的容错路由算法,已成为多计算机系统互连网络的一个重要研究课题。局部扭曲立方体作为超立方体的变体,是一种新型的网络拓扑结构,保持了超立方体的很多优点,如连通度,对称性,可递归构建性,哈密尔顿性等。另外其也有很多优于超立方体的性质,如小的网络直径、泛圈性等。因此我们就可以通过利用这些性质来设计高效率的容错路由算法。该文首先介绍了三类典型的容错路由算法,分别为基于局部故障信息、基于全局故障信息以及基于有限全局故障信息的容错路由算法。针对每类算法,进行详细分析,指出了它们各自的优点和缺点。通过对上述三类容错路由算法的分析,该文引入了节点安全级和路由选择能力的概念。针对节点发生故障的情况,设计了一个单播容错路由算法A和一个广播容错路由算法B;针对节点和边同时发生故障的情况,设计了一个单播容错路由算法C。其中算法A、C都引入了回溯机制。A算法利用节点安全级,除了考虑相邻节点的安全状况外,还充分利用了局部扭曲立方体自身特有的结构,使得信息尽可能沿最优路径传递。C算法则是利用路由选择能力容错路由,并得出了一些很好的结论。通过模拟仿真实验,可知A、C算法均具有较高的容错能力。当故障节点的数目达到或超过一半时,A算法仍能保持在一个相当高的容错路由成功率上,且该算法所选线路在多数情况下是最短距离;当有大量的边和节点同时发生故障时,C算法也能成功地实现消息传递,且保证容错路由绝大多数为最优路径或者次优路径。特别是对于出现大量故障边的情况,该算法表现出了很好的容错路由能力。其中C算法在沿最优路径传递方面要优于A算法。当有大量故障节点出现的时候,适合使用A算法;当有大量故障边或者少量故障节点出现的时候,则更适合使用C算法。另外,A、C算法对发生的故障数目均没有做任何限制。B算法将节点安全级引入了进来,在设计时充分考虑了相邻节点的故障状况。通过证明,可知若源节点为安全节点,广播能够在n步内完成;若源节点为不安全节点(故障节点数小于n),广播能够在n+1步内完成。且该算法的时间复杂度为