基于GPU的硬件加速方法在粒子模拟中的应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cxsxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机性能的飞速发展,人们渴望能够更加精确的模拟等离子体的特性。为此全三维相对论的粒子模拟逐渐被提出来,引入的宏粒子数目达到106~1010个,这使得PIC模拟消耗的计算机资源(包括计算机内存以及计算时间)呈数量级的增长,为了解决庞大的计算负担,开发相应的并行PIC模拟算法非常重要。并行PIC模拟的很多成熟算法都基于传统体系结构的中央处理器(CPU),但是CPU的有限资源成为计算瓶颈。过去的十年里,一种新的大规模并行处理器——GPU(Graphic Processing Unit,图形处理器)开始被应用到科学计算领域。本文第一章介绍了等离子体粒子模拟的发展概况以及在计算中所面临的问题。GPU的发展历程和应用于并行计算的发展概况。本文第二章介绍了一种将GPU视作数据并行计算设备的软硬件体系——CUDA统一计算设备架构。详细的描述了在分析问题的过程中对计算任务进行粗粒度和细粒度的方法,以及CUDA模型中大规模的并行线程在GPU硬件中的映射方法、调度执行方式。本文第三章以模拟多环形电子注在圆柱系统中的运动轨迹为例介绍了等离子体的粒子模拟方法。其中理论分析包括:电子运动方程的求解、电荷源的求解以及Poisson方程的求解三个部分。由于电子注的环形特征以及圆柱系统的轴对称性,采用圆柱坐标系及该坐标系下的网格划分来进行理论分析和数值模拟。本文第四章结合第二、三章的介绍,分析了PIC模拟在GPU上的可行性,提出了总体的实现流程。把整个计算分为了带电粒子运动求解,网格点电势更新,电荷密度求解,其中将电荷密度算法修改使其可以用原子函数来计算,避免了内存写入冲突。给出了它们数据并行处理的CUDA实现方案,并与CPU串行程序进行了对比,得到了较高的精确度和10倍的加速比。
其他文献
该课题在分离获得不同侵袭能力人前列腺癌细胞PC-3M亚系的基础上,比较了各亚系u-PAR的表达,构建u-PAR反义核酸载体并导入高侵袭亚系中,观察了u-PAR反义核酸的抑制效应.以期为
猪链球菌(Streptococcus suis, S.suis)为革兰阳性球菌,根据其荚膜多糖的差异可以分为35个血清型,其中2型猪链球菌(S.suis2,SS2)致病力最强,分布最为广泛。SS2是一种重要的人畜共
目的 分析房角分离术联合白内障超声乳化吸除术治疗原发性急性闭角型青光眼合并白内障的临床疗效.方法 92例急性闭角型青光眼合并白内障患者,随机分为对照组与观察组,每组46
目的 比较经鼻高流量氧疗(HFNC)与无创正压通气在海水淹溺肺水肿中的治疗价值.方法 62例海水淹溺肺水肿患者,根据随机数字表法分为对照组和观察组,各31例.对照组给予无创正压
目的:在该实验中,我们分析了肠型胃癌病人标本中正常粘膜、胃癌、以及肠化生细胞内的一些重要的肿瘤相关基因表达情况及E-cadherin基因启动子甲基化情况;在所有标本中检测了
近年来,电源管理类芯片设计技术不断提高,高集成度、高性能、低成本成为广大设计工程师追逐的目标。其中,线性稳压器以其低噪声、高电源电压抑制比、低EMI等特点被广泛应用于各
目的 观察分析宫颈癌三维(在CT图像引导下)后装治疗中两种优化方式的剂量及相关性.方法 26例宫颈癌患者,随机分为实验组和对照组,每组13例.对照组应用手动优化的后装治疗计划
目的 探究Rüedi-Allg?werⅢ型Pilon骨折患者治疗中不同入路方式的应用效果.方法 80例Rüedi-Allg?werⅢ型Pilon骨折患者,随机分为对照组和研究组,每组40例.对照组实施有限内
目的:1.建立一种简便、高效、快捷的提纯LAM的方法.2.分离纯化HR LAM的同种型.3.HR LAM同种型的结构分析和功能鉴定,为深入了解LAM的免疫机制奠定基础.结论:1.该实验建立了一
该实验通过培养原代幼大鼠脑神经元细胞,并在不同时间用不同浓度醋酸铅处理细胞,通过同时测定胞膜PKC、TPK的活性,一方面在正常神经细胞中验证铅对胞膜PKC活性影响的真实情况