【摘 要】
:
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换
【机 构】
:
深圳大学计算机与软件学院,广东深圳518060国家高性能计算中心深圳分中心,广东深圳518060;
论文部分内容阅读
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现矩阵乘法的向量化运算,同时针对矩阵乘法中各矩阵的访存特点设计合理分块策略,并运用3B1500的cache锁机制将重复利用率高的分块锁在cache中以减少cache缺失,最后针对矩阵A和B的预取时间大于计算时间这一问题,设计了一种新的矩阵预取算法.该预取算法通过增大核心计算的计算量,将矩阵A和B的预取时间全部掩藏在计算中,并且通过ld指令与$0寄存器的配合使用来实现对C矩阵的预取.优化后的DGEMM函数无论在单线程和多线程时的性能都达到了理论峰值的80%以上.
其他文献
在2014南国书香节暨羊城书展举办之际,广东科技出版社出版由“全国农业科技推广标兵”姚国成编著的《授人以渔》一书。
通过HPLC法比较湘西宏成制药有限责任公司不同中药种子繁殖基地白花泡桐叶中熊果酸和木犀草素的含量。所采用的色谱柱为Shim-Pack C18(4.6 mm×150 mm,5μm),测定熊果酸的流
随着我国道路交通的飞速发展,我国路桥建设也随之迅速发展,同时对路桥工程的质量,尤其是路基路面的质量的要求越来越高,路桥工程的质量主要是由路基路面的质量决定的,只有对
自从第三次科技革命以后,全球的科技水平在各个层面都得到了不断的发展.而在全球科技水平发展的同时,当前的电子信息工程也在不断的发展,使用的领域越来越来越广泛,在人们生
对于水利工程,在建设的时候,时常使用软土地基进行处理.但是因为其具有很高的压缩性能、强度比较低、含水量比较大等特点,这样就很大程度的加大了地基处理的难度,针对这样的