同步开销相关论文
随着虚拟化技术的流行,越来越多的学术机构和企业开始尝试将紧耦合的并行应用放到云端来运行。为了提高资源利用率,云平台中多个虚......
通过利用ORTHOMIN(m)算法的固有性质,消除ORTHOMIN(m)算法的内积计算数据相关性,给出了一种改进的OR-THOMIN(m)(IORTHOMIN(m))算法。同0RTHOMIN......
为了在分布式并行环境中求解大型稀疏线性方程组,对变预处理SOR-双共轭残量算法(简称SOR-BICR)的计算次序进行重构进而得到改进的变......
通过改变CR算法的计算次序。提出了一种改进的共轭剩余(ICR)算法.对比CR算法。ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量。......
针对单机计算已不能满足求解大规模稀疏线性方程组的问题,提出一种Krylov子空间方法的并行化设计方案,改进之处在于用一次同步通信......
计算进入了多核时代,处理器的发展不再由更快的主频带动,而是依靠增加片上的多个核心.但是,对于高性能应用来说,多核平台的并行处......
MPIAlltoall是一种重要的集合通信.在多核机群中,一个节点内的多个进程同时参与Alltoall通信.一方面,这些进程可以利用共享内存优化通......
针对大型非对称稀疏线性方程组的求解,通过利用广义共轭残差(GCR)算法的固有性质,消除GCR算法的内积计算数据相关性,给出一种改进的广义......
TFQMR算法是一种Krylov子空间算法,常用来求解大型稀疏线性方程组.通过改变TFQMR算法的计算次序,提出了一种改进的TFQMR(ITFQMR)算......
针对多尺度预报模式离散得到的非对称稀疏线性方程组的求解,通过利用GCR(k)算法的固有性质,消除GCR(k)算法的内积计算数据相关性,给出了一......
摘要:MPI的3.0版新增了非阻塞集合通信。非阻塞集合通信兼顾非阻塞和集合通信的特点,与阻塞集合通信相比具有更低的同步开销,能够实现......