发动机燃烧数值模拟程序的多核与众核并行技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:JK0803_lijixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,片上多核CPU已成为高性能微处理器的主流体系结构,图形处理器(Graphics Processing Unit,GPU)也被广泛用作计算加速部件。为使应用程序能够利用多核CPU和GPU,需要专门的并行算法设计和深入的性能优化。TURFSim(Target Unsteady Reacting Flow simulation)是一个在结构网格上进行发动机燃烧数值模拟的CFD应用程序,计算量巨大。为了使TURFSim能够充分利用当前的高性能计算平台进行计算,本文针对多核CPU和众核GPU计算平台,开展了并行计算技术的研究。论文主要工作包括:1.面向多核CPU,实现了TURFSim程序的OpenMP并行,在此基础上研究不同调度策略以及chunksize的大小对该程序性能的影响,然后根据程序中循环体的访存特点,研究访存局部性对性能的影响及其优化。在包含2个Intel Xeon E5-2660 CPU(每个CPU含10个核)的高性能计算节点上进行了性能测试,结果表明对网格规模为480万的数值模拟,OpenMP版本相对于串行版本可以获得11.75倍的加速比,20个线程时的并行效率达58%以上。2.面向CPU/GPU异构平台,实现TURFSim程序的MPI+OpenMP+CUDA三层混合异构并行移植,针对GPU的层次结构设计了基于网格点的并行实现方式,并结合程序特点与异构平台的硬件资源配置进行了并行优化,包括:(1)从共享内存和寄存器利用情况分析其对程序性能的影响;(2)针对CPU与GPU间的数据传输,通过使用Pinned Memory来提高数据传输速度,提出了打包/解包方法减少数据传输量,降低数据传输的时间开销,同时采用非阻塞传输方式使计算与数据传输重叠;(3)使用CUDA流控制任务调度序列来提高GPU上的执行性能。在高性能计算平台(每节点含2个Kepler架构的K80 GPU)上进行了性能测试。实验结果检验了GPU并行与优化的效果,在高性能计算平台上,相对于原纯CPU使用20个CPU核并行计算时的最高性能,GPU并行最高获得2.85倍的加速比。
其他文献
随着我军编制体制调整改革,新阶段新任务的不断部署,对于通信保障的要求也越来越高,原有军用光缆网通信保障随域接入能力较弱,带宽利用率不高,线路迂回路由欠缺、安全保密存在隐患等问题愈加凸显,为确保军用光缆网通信稳定运行、科学高效的使用,满足新编制体制下的通信业务融合和新质战斗力生成的现实保障需求,开展军民融合条件下军用光缆网通信保障模式研究具有十分重要的意义。本文研究的重点方向是军民融合,主要以军用光
学位
利比亚自1969年卡扎菲上台执政以来,对外奉行亲苏俄反西方政策,对内实行高压独裁统治。2011年,利比亚爆发全国性骚乱,西方国家以人道主义援助为借口,向利比亚派出多国联合部队,支持反卡扎菲政权的“利比亚全国过渡委员会”,利比亚战争爆发。此战,多国部队以其高效的战场情报保障体系,支撑起为期7个多月的空袭作战和精确火力打击,最终取得了战争胜利。本文着重对多国部队在这场战争中的战场情报保障工作进行全面系
学位
随着我国航天发射任务的高密度、高难度趋势越来越明显,在航天发射任务中运载火箭型号、航天器类型、测控频段、测控方式和要求也发生着巨大变化。为适应不同类型航天发射的测控需求,海基测控任务中需实时处理的数据内容越来越多、处理方法越来越复杂、处理要求也越来越高。海基测控数据处理软件虽经历了汇编语言、面向过程编程到面向对象编程等一系列技术改造的演变,但仍无法很好地适应需求日益变化的形势。本文回顾了基于测控数
学位
核能作为一种新型能源,在当下的能源体系中占有重要地位,但在核燃料使用后产生的高放废液对环境具有很大的危害,其中实现高放废液中次锕系元素和镧系元素的有效分离对于采用“分离-嬗变”法实现高放废液的后处理有着十分重要的意义和作用。由于次锕系元素具有放射性,且镧系元素Nd3+(钕)与锕系放射性元素Am3+(镅)半径相近、性质相似,本文用Nd3+模拟Am3+,以一种二硫代次膦酸衍生物作为萃取剂配体,通过与萃
学位
副溶血性弧菌是海产品中最常见的食源性致病菌,食用生的或加工不规范的海产品极易导致食物中毒,引发人类急性肠胃炎。目前,副溶血性弧菌在海产品中的检出情况以及在食品贮藏中的消长情况已有大量研究,而基于细菌在海产品加工过程中消长变化的相关研究较少,特别是其毒力变化往往被忽视。因此,研究海产品加工过程中副溶血性弧菌数量以及毒力的变化规律,有助于在加工环节提供安全控制,进而更好地保障食品安全。本研究内容具体结
学位
随着数字货币的快速发展,底层区块链技术逐渐成为研究者广泛关注的焦点和热点。时至今日,区块链技术带来的价值远远超过数字货币本身的价值,并成功应用于金融、政务、医疗、公益和版权保护等多个场景。从本质上讲,区块链是一个去中心化的公开共享的分布式数据账本,但在实际应用中公开透明等特性带来了隐私保护问题,该问题包括用户的匿名性和用户数据的机密性。其次,为了促进区块链技术的安全应用,需加强监管手段,强化区块链
学位
近年来,发动机污染物尤其是氮氧化物(NOx)的排放要求日益严格。贫燃预混预蒸发燃烧技术(Lean Premixed Prevaporized,LPP)是目前最有可能实现极低NOx排放的燃烧技术,其多采用中心分级的双旋流燃烧组织模式。但由于双旋流燃烧模式复杂,影响因素众多,贫燃预混火焰极易引发回火、燃烧不稳定等问题,为LPP燃烧室的应用带来了严峻的挑战。本文以双级轴向旋流预混燃烧器为研究对象,通过实
学位
本篇英汉翻译实践报告的原文节选自传记文学《幸存者》一书。作为一部有关家族历史的回忆录,该书记录了战后重大创伤在代际间的持续影响,同时也展现了治疗创伤的希望。作者亚当·弗兰克尔的外祖父扎伊德是立陶宛犹太人,扎伊德尚年幼时就与父亲身陷各种贫民区和战时集中营。战后,虽然扎伊德及妻子幸免于难并移民美国,试图把痛苦的过去抛诸脑后,但是,他们在战争中所遭受的痛苦还是延续给了后代。通过直面自己的家族历史,弗兰克
学位
基于压缩感知的单像素成像技术允许在低采样率下执行高精度的图像重建。因其具有探测灵敏度高与带宽大的优点,使其可对从近紫外到远红外甚至太赫兹波段响应,进而满足复杂环境(如非视距、穿透散射介质)的成像需求。时间相关的单光子计数技术(Time-Correlated Single Photon Counting,TCSPC)因具有高灵敏度和高精度的探测属性而备受关注。其以统计分析为基础的测量方式可通过记录光
学位
嫩度是消费者最重视的肉类食用品质之一,改善宰后嫩度最常用方式是4℃自然冷却成熟。由于动物宰后短时间内会流失大量血液,停止氧气摄入,随后动物肌细胞会进入不可逆的缺氧、缺血、缺乏能量的状态,机体为维持自身稳态发生“细胞凋亡”和“细胞自噬”。其中,细胞凋亡酶caspase-3促进肉嫩化的机制已被证实。此外,细胞自噬参与肌肉宰后成熟早期阶段,并与细胞凋亡协同作用促进肉嫩化。槲皮素对4℃贮藏期间羊肉、鸡肉品
学位