论文部分内容阅读
利用SMP结构的多处理器结点通过高速网络构造高性能并行计算系统是当前的一种发展趋势.为了使BLAS在SMP结点上具有更高的效率,本文讨论了BLAS3的多线程化问题;同时以SUMMA作为并行计算的实例,说明提高结点机程序的性能对并行计算性能的影响.试验结果显示,在一定的条件下,多线程BLAS3在SMP平台上可以获得超线性加速比;结点计算性能的提高的同时必须提高网络有效带宽,才能充分发挥并行计算的效能.