论文部分内容阅读
本文旨在讨论GPC算法[1,2]的并行化问题,通过对原串行算法的数据流及数据相关性的分析,得到了一种三角阵列的并行算法。该算法自然导致Systolic结构,并具有良好的数值稳定性。对于一个 n阶系统而言,本算法采用O(n2)阶的处理器单元互连成三角阵列,可以把计算时间由原来的O(n3)阶(内积运算)时间提高到 O(n)阶,因而具有 O(n2)的加速比,其处理器的利用效率得到了很大提高。