论文部分内容阅读
该文在ARMv864位多核处理器上基于OpenBLAS首次设计、实现并优化了四精度矩阵乘法(Quadruple precision General Matrix-Matrix Multiplication,QGEMM).由于浮点计算中不可避免地引入舍入误差,双精度矩阵乘法(DGEMM)在某些情况下不能给出令人满意的数值结果,因此需要高精度或多精度算法来实现更精确的计算.Double—double算术是一种较为有效和广泛使用的手段.文中采用double—double数据格式构建结构体存储四精度浮点数据;基于