神威平台上等离子体保结构大规模模拟的并行算法分析与优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:shuguang_888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着处理器技术的发展以及应用对计算需求的增长,微处理器片上集成的资源与核心数越来越多,呈现出异构众核的发展趋势。我国性能最强的超级计算机神威·太湖之光便由40960个自主设计的众核异构处理器SW26010构成。SW26010处理器采用了特殊的主从核结构,片上集成了 260个异构计算核心,能够提供高达3.06TFlops的峰值性能,然而其独特的硬件架构也对并行软件的开发提出了极大挑战。SymPIC是一款采用保辛结构算法针对Vlasov-Maxwell等离子体系统的模拟软件,能够支持长期大规模高效等离子体问题模拟。本文的研究目标是基于等离子模拟软件SymPIC,针对神威众核平台重新实现和优化等离子体大规模模拟的并行算法,克服硬件架构上的一系列难题,充分释放硬件计算能力,并从应用角度出发为国产超算系统结构改进提出参考意见。本文的主要研究工作与成果包括以下几个方面:(1)为了深入理解SymPIC的代码结构与运行时行为特征,本文在商用平台上进行了大量的分析工作。一方面,对SymPIC的程序结构进行分析,介绍其组成模块以及主要函数调用关系,并在此基础上给出了计算核心代码结构与数据结构。另一方面,在商用平台上利用性能分析工具对SymPIC进行全面的测试分析,明确了其计算、访存、通信与I/O的行为特征,为神威平台上的优化工作提供参考。(2)介绍了 SymPIC在神威上的并行算法与优化方案。首先给出了任务划分、核心代码结构以及并行编程模型等并行算法细节,并进行了针对性的瓶颈分析。针对计算效率低的问题,本文提出了两种不同粒度的向量化方案,充分挖掘其数据级并行性,并在一定程度上缓解了指令Cache缺失率高的问题。为了克服访存严重受限的问题,通过DMA操作与数据重排布两种手段加速数据在存储器间的移动,并设计了软件模拟Cache与多缓冲区预取方案实现数据重用与访存开销隐藏。最后,提出了分布式I/O方案保证大规模I/O性能,将输出结果文件开销控制在可接受范围内。(3)设计了详尽全面的实验以对神威太湖之光平台上的SymPIC进行性能评估,实验结果表明相对于纯主核版本与从核并行化版本,优化后的SymPIC取得了 88.30倍和2.57倍的加速比,同时强弱可扩展性测试的并行效率分别能够达到86%和94%以上。本文还分析了 SymPIC在神威·太湖之光上的软硬件受限情况,为国产超算软硬件的改进提供参考。
其他文献
聚电解质及其在锂离子电池、太阳能电池、燃料电池和超级电容器等领域的研究和应用广泛。本论文设计合成了含有三唑离子的聚乙炔衍生物,通过化学掺杂,得到具有离子和电子双重
目前,数据的特征多种多样,对数据进行充分挖掘成为许多研究的重点,数据的特征有时会影响数据本身的性质,如医学数据中,许多特征都是息息相关,但有些特征没有联系,将所有特征
社交网络和在线平台的兴起不仅增加了初创企业寻找初始投资的机会,同时也为非机构投资者提供了更多的投资渠道。在“互联网+”背景下,众筹发起人在网络平台上发起众筹项目,直
随着汽车、通信、机电、通机等产业的高速发展,对压铸产品的需求量正不断增加,与国际先进企业相比,国内压铸制造业普遍存在能耗高、能量效率低、设备利用率低、产品表面质量
随着计算机和人工智能的迅速发展,机器人技术也得到了快速的发展,越来越多的学者开始研究机器人,并逐步将其运用于人们的生产生活当中。人们的需求并没有得到满足,搬运、跟随
随着信息技术的飞速发展,移动互联网络广泛普及,大量快速更新的数据使得现实问题复杂度随之增加。如何高效快速进行大数据分析,引起学者广泛关注。大数据研究旨在大量动态变
随着科技的发展,人类对能源的需求量逐年提升,传统化石燃料为主的的能源结构给环境带来了巨大的压力,温室效应、大气污染及雾霾等问题日益突出。为了解决以上问题,寻找清洁的
携带轨道角动量的涡旋电磁波是一种特殊的电磁波,其相位波前与传统平面波不同,具有螺旋式相位分布,在旋转目标的检测方面具有独特的优势。基于涡旋电磁波探测旋转目标时形成
准确、高分辨率的人口空间分布信息对城市规划、灾害评估、疾病预防以及精准扶贫等都具有重要的参考价值。然而,传统的人口空间化研究存在模型单一、建模辅助因子单一、格网
我国西部地区地形复杂,容易发生道路边坡落石灾害侵占道路,阻塞交通。为了保障交通通行,需要及时对道路侵害程度进行评估,向有关部门汇报。本文提出了一套基于平行双目视觉的