面向龙芯3A体系结构的BLAS库优化

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:vitaver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEMM来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(GotoBLAS)的2倍多.
其他文献
目的:探讨书画训练对精神分裂症住院患者康复效果的影响。方法将72例精神分裂症患者随机分为两组,每组36例,均常规应用抗精神病药物治疗、常规护理干预及集体性心理干预,研究组在
目的:探讨肌内注射齐拉西酮注射液治疗精神分裂症患者急性激越症状的疗效和安全性。方法将80例伴急性激越症状的精神分裂症患者随机分为两组,实验组肌内注射齐拉西酮注射液治疗
目的:探讨帕利哌酮缓释片与利培酮治疗男性急性精神分裂症患者的临床疗效和安全性,以及对社会功能影响。方法将80例男性急性精神分裂患者随机分为两组,每组40例,研究组口服帕利哌
目的:探讨抗精神病药物联合丙戌酸镁缓释片治疗精神分裂症攻击行为的临床疗效和安全性。方法将60例具有攻击行为的精神分裂症患者随机分为两组,均口服新型非典型抗精神病药物常
目的:探讨米氮平联合小剂量奥氮平治疗精神病性抑郁症的疗效和安全性。方法将77例精神病性抑郁症患者随机分为两组,均晨口服米氮平治疗,观察组联合小剂量奥氮平治疗,观察3个月。
目的:探讨度洛西汀联合喹硫平治疗难治性抑郁症的临床疗效和安全性。方法将80例难治性抑郁症患者随机分为两组,每组40例,研究组口服度洛西汀联合喹硫平治疗,对照组口服度洛西汀治
目的:探讨利培酮与奋乃静治疗老年期精神分裂症的临床疗效和安全性。方法将60例老年期精神分裂症患者随机分为两组,每组30例,研究组口服利培酮治疗,对照组口服奋乃静治疗,观察24周
本文试图以古代星象学的空间图形和风水学说的理想空间理念,解释(传)梁武帝“龙跳天门,虎卧凤阙”一语,以证明此语评价王羲之书法的精准性和确切性。同时,通过进一步的辨析,
目的:探讨哌罗匹隆与利培酮治疗首发精神分裂症患者的临床疗效和安全性。方法将120例首发精神分裂症患者随机分为两组,研究组口服哌罗匹隆治疗,对照组口服利培酮治疗,观察8周。采