【摘 要】
:
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工
【机 构】
:
国防科技大学并行与分布处理重点实验室
论文部分内容阅读
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实
其他文献
针对WSN层次型路由协议中簇首单跳传输数据至汇聚节点、而部分簇首因传输距离过长导致能量过早耗尽从而影响整个网络寿命问题,提出了基于剩余能量对簇首优化选择和簇首至汇聚
在已完成的16根无粘结部分预应力混凝土梁低周反复荷载试验的基础上,合理地选择了各材料的本构关系模型,深入分析了无粘结部分预应力混凝土梁的受力特性,通过设置刚性短臂将
基于正八边形多胞薄壁管相比其他截面形状薄壁管具有结构紧凑、比吸能高等特点,采用有限元软件Abaqus研究了其在准静态轴向压缩下的吸能特性,分析了不同截面形状和结构参数对
采用 Gleeble-3500热模拟机,在变形温度为950~1150℃、应变速率为0.001~10 s^-1的条件下,研究了粗大柱状晶粒纯镍的热变形行为和加工图.结果表明:热压缩过程中流变应力随应变
针对洪涝灾害的特点,进行了洪涝成因分析,并提出了工程和非工程防洪措施。
为了提高 Al-1.1Mg-0.3Cu 合金线杆的拉伸性能,通过金相、透射电镜、扫描电镜显微组织观察和拉伸试验分别对连续挤压态及拉拔退火态合金的微观组织和拉伸性能进行了研究.结果
分布式电源接入配电网后,孤岛运行可以作为一种新的故障恢复方式,保障重要负荷的供电.本文提出了一种基于距离权重搜索孤岛的启发式孤岛划分方法,以恢复的重要负荷最多为主要
旨在研究制造业的物流缓存区的布局优化问题,在满足物流缓存区的作业和布局要求的前提下,建立布局优化的数学模型;结合某企业物流缓存区的相关数据,利用遗传算法并运用Matlab