VALU加速相关论文
研究了在共享内存式计算机架构下,基于OpenMP及VALU硬件加速的多层快速多极子的混合并行算法.着重讨论了多层快速多极子并行程序设......
在常规并行方案的基础上,继续挖掘CPU计算潜力,从CPU指令级优化入手,借用CPU的矢量运算单元(VALU)和SSE指令集,实现了在一个指令周期......