基于SMAT的稀疏BLAS库和解法器优化技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:red0035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件工艺的发展和架构的创新,众核体系和异构平台越来越成为高性能计算系统的主流方式。基于众核跨平台的应用设计和程序优化正在成为高性能计算的研究热点。与传统的多核处理器相比,GPU和MIC这种众核架构集成了更多的核心,具有更高的并行度,提供更高的访存带宽和更强的浮点计算能力。以往的程序优化方法很难直接移植到众核异构平台。对于现代科学计算中最常用的稀疏矩阵向量法,研究其在众核异构平台上的算法实现及优化是非常有意义的。  稀疏矩阵向量乘(SpMV)是科学与工程计算代数解法器中的核心共性操作,属于典型的访存受限运算。其性能的优化非常具有挑战性。此外,稀疏矩阵的存储格式众多,不同的存储格式对于不同类型的稀疏矩阵和不同的硬件平台,性能差异很大。对于特定的输入,找到一个最优的存储格式将会对计算效率有很大的提高。在当今复杂的异构平台中,开发一个方便可靠、具有高效率而且具有自动调优功能的的数值计算系统是非常有挑战和重要意义的研究工作。  本文的主要工作和贡献如下:  (1)设计并实现了一个跨平台,支持多种稀疏矩阵格式的稀疏算法库spBLAS。采用面向对象方法,将矩阵和向量的操作进行高层抽象,将硬件平台的具体细节屏蔽,为用户提供了一个方便且高效跨平台、高可扩展性的稀疏算法库。  (2)设计并实现了基于spBLAS库的数值解法器,并将其与SMAT自动调优技术结合,设计并实现了一个稀疏线性计算系统SMATER。通过数据挖掘的方法研究稀疏矩阵的特点、硬件平台特性以及SpMV性能之间的关系,对不同的稀疏矩阵给出最优的存储格式及SpMV算法实现。  (3)结合众核体系结构特征和稀疏矩阵自身特点,对SpMV程序进行了优化,总结了SpMV的普遍优化方案,从硬件平台、单线程、多线程和稀疏矩阵格式等各方面给出了优化方案和实现,为异构平台的程序优化提供了参考。
其他文献
互联网的迅速发展,Internet上各种领域的信息越来越丰富,如何对所需求信息进行高效的访问成为日益重要的问题。Web信息集成系统提取来自异种数据源网页中的数据,集成到XML或者关
随着互联网和地理信息系统(GeographicalInformationSystem,GIS)的发展,越来越多的网络GIS服务在互联网上出现,并且得到广大网民的欢迎和接受。在Google和百度两大搜索引擎公司
近年来,移动互联网迎来了爆发式的增长,移动设备的普及,4G以及WIFI网络的广泛覆盖使得多媒体服务变得更加便捷,用户可以随时随地通过移动设备获取多媒体服务。移动设备自身资
随着语义网研究的不断的成熟,许多机构和组织开发了用于知识共享的本体来描述网络资源和信息。由于本体的设计者观点存在着差异,导致所设计出来的本体有很大的异构性,阻碍了知识
本文主要讨论量子指纹协议中的两个基本问题:无纠缠量子指纹的最优性;共享纠缠量子指纹的性质,及其最大错误率下界与纠缠量(用Schmidt数度量)之间的关系.本文首先简单回顾了量子
在信息技术飞速发展的今天,以Web2.0概念为主导的重要网络应用“社区问答系统”现已逐渐成为人们网上信息获取和经验知识分享的重要渠道。百度知道、Yahoo!Answers、知乎等作
绩效管理和绩效考核是做好实际工作、实现组织战略目标的重要管理工具和手段。在本文拟要分析和解决的新闻宣传和稿件投稿工作中,我们以绩效管理和相关信息技术为理论依据和实
学位
大规模对称矩阵特征问题存在于许多科学计算领域与工程设计中,而且在许多科学应用的软件代码中也包含着对称特征问题的求解。然而随着求解问题规模的不断增大,存储空间和计算时
随着计算机和网络技术的发展,“无缝计算”、“移动计算”等概念已经成为21世纪信息技术的新焦点,在这种环境下瘦客户机/服务器架构以管理集中节省资源等优点发展迅速,而支撑这
曲面建模是计算机图形学的重要研究领域。近二十年来,随着三维数据采样设备的长足进步与复杂拓扑结构的曲面造型日益普及,细分曲面已成为计算机辅助几何设计(CAGD)和计算机图形