面向异构体系结构的稀疏矩阵算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:guaidaokid2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向异构体系结构的稀疏矩阵算法已经成为高性能计算领域的关键问题之一。稀疏矩阵算法是自然科学和社会科学中许多领域进行数值模拟计算时的关键技术和性能瓶颈,为了提高稀疏矩阵算法的计算性能,需要提高相应算法在特定平台上的计算效率。然而,一方面,稀疏矩阵算法的计算与访存行为与矩阵的稀疏结构相关,是典型的不规则类算法,很难发掘时间与空间的局部性;另一方面,随着包含算法加速器的异构并行体系结构成为高性能计算机体系结构的主流,并行程序执行效率的影响因素日益复杂多样,传统的面向具体平台的程序并行与优化方法已经无法满足高效率并行程序的开发需求。为了应对这些问题和挑战,本文对面向异构体系结构的稀疏矩阵算法进行了深入的研究,主要工作与创新点如下:(1)提出了面向CPU-GPU异构平台的搜索方向优化的宽度优先搜索算法。本文实现了基于GPU的自底向上的宽度优先搜索算法,提高了GPU线程访存的连续性并降低了线程间负载的不均衡,并进一步实现了CPU-GPU协同的自底向上的宽度优先搜索算法,充分利用了CPU-GPU异构并行计算平台上所有的计算资源,并有效提高了宽度优先搜索算法对大规模节点前沿的处理速度。在此基础上,设计了面向CPU-GPU异构体系结构的优化搜索方向的宽度优先搜索算法,通过结合基于多核CPU的自顶向下的串行宽度优先搜索算法、自顶向下的并行宽度优先搜索算法以及CPU-GPU协同的自底向上的宽度优先搜索算法,提高了宽度优先搜索算法对不同规模节点前沿的适应性。(2)提出了面向CPU-GPU异构平台的稀疏矩阵向量乘算法。本文提出了基于索引信息压缩的稀疏矩阵分块存储数据结构,通过合并位置相近的同行非零元,减少了矩阵非零元素对应的索引信息的数据量,从而一方面提高了稀疏矩阵访存的规则性和局部性,另一方面控制了填零元所引入的额外的计算和访存开销,并通过采用二级混合存储数据结构提高了对于矩阵不同稀疏结构的适应性。在此基础上,实现了基于计算访存量的负载均衡算法,分别设计了针对多核CPU和GPU的优化的Sp MV算法,有效的提高了稀疏矩阵向量乘算法的计算效率,并进一步实现了CPU-GPU协同的稀疏矩阵向量乘算法,充分发掘了异构体系结构计算平台的计算能力。(3)提出了面向异构平台的基于超节点数据结构的稀疏矩阵分解算法。本文以稀疏矩阵Cholesky分解算法为研究对象,在数据组织方面,改进了稀疏矩阵超节点数据结构,通过超节点合并和分块控制计算粒度;在计算调度方面,将分解过程映射为一系列的数据块任务,并设计了相应的任务生成与调度算法,在满足数据依赖性的前提下提高任务的并行性,从而显著提高了稀疏矩阵Cholesky分解算法在GPU上的实现效率。通过将控制任务和计算任务分别映射到CPU和GPU上,有效提高了CPU-GPU异构平台上稀疏矩阵分解算法的计算性能。(4)提出了面向CPU-GPU异构平台的稀疏三角方程组求解算法。本文提出了面向稀疏结构的分块处理策略,根据稀疏三角矩阵非零元密度的不同将计算过程分解,并设计了基于分块数据结构的稀疏三角方程组求解算法。在此基础上,设计了面向负载均衡的线程映射算法,并针对GPU设计了基于线程warp的计算组织策略,降低了GPU线程的控制分支所造成的性能损失,并进一步实现了CPU-GPU协同的稀疏三角方程组求解并行算法,有效提高了CPU-GPU异构平台上稀疏三角方程组求解算法的计算效率。
其他文献
难度无声的语言变成有声的语言,是对文字信息的再创作。小学语文教学大纲明确指出:“朗读能发展学生的思维,激发学生的情趣。学生朗读能力逐步提高,对课文内容的理解会逐步加深。
英语师范教育课程中学科教学知识的培养,有助于教师将所获得的英语学科知识内容以及技能充分转变为一种有效的课堂教学行为,实现教师专业知识与教学实践的有机结合,并得出适
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
SS型施工升降机吊笼安全保护装置魏敏,潘建广1主要工作原理根据国标GB10055-96《施工升降机安全规则》规定:吊笼应设有安全装置,特别是对卷扬机传动的升降机,应设断绳保护安全装置。安全装置应
新媒体时代的到来,不仅仅冲击的是传统媒体方式,更是对现代人的阅读方式产生了巨大的影响和转变。对于少儿读者这个群体而言,不再是只能到书店和图书馆才能看到自己想看的书籍。
认清“何处有何物”是人类视觉要解决的核心问题。生理学研究发现,人类视觉系统中存在着两条不同的视觉通路分别处理“何处”和“何物”的问题。本文正是以两条视觉通路为依
进入4月以来,南亚地区持续高温,印度、巴基斯坦两国不断刷新历史同期最高温度记录。在印度,气温持续上升,突破摄氏48度,学校纷纷停课,学生们一股脑涌入河水中(图③)。本已干旱的土
随着新媒体时代的到来,开放的互联网环境为网络综艺节目的制作提供了众多新的可能性与发展方向。2014年,由爱奇艺打造的中国首档说话达人秀《奇葩说》进入公众视野。这档网络
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield