基于CUDA并行框架的简化球谐波模型快速求解方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kinggaoblog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学分子成像作为一种迅速发展的医学影像技术,由于具有无创性、高灵敏度、高时间分辨率、成像价格低等优点而得到了广泛重视和应用,近年来已经成为了影像领域的研究热点。在光学分子成像领域中,光子在生物组织中传输过程的精确建模与快速求解具有重要的研究意义。本文围绕生物组织中光传输问题展开研究,通过详尽地分析各种光传输前向模型,特别是简化球谐波模型(simplifiedspherical harmonics,SPN)的特点,针对该模型的数值求解方法进行了深入的研究,并探讨了有限元数值求解方法移植到图形处理器(graphics processing unit,GPU)并行执行的可行性。对于多维复杂几何结构,随着近似阶数N的增大,SPN模型将会面临计算量较大的问题。同时考虑有限元算法作为一种离散化近似求解的数值方法,具有天然的可并行性。因此,本文提出了一种基于GPU高性能计算的并行有限元算法,用于加速求解基于SPN方程的光传输过程。本方法采用由NVIDIA公司推出的通用并行计算框架——统一计算设备架构(compute unified device architecture,CUDA)作为并行计算解决方案,使其求解结果能够在确保较高精度的同时,又缩短了大量的计算时间。在充分考虑CUDA平台GPU的硬件特点后,本文又对有限元算法程序中计算量较大的线性方程组求解部分进行了相应的算法优化设计,包括精简优化GPU核心函数代码和对程序结构、存储器、数据通信进行合理优化,充分利用GPU资源,进一步提高并行加速性能。通过与蒙特卡罗仿真结果对比,验证了基于CUDA并行框架的SPN快速求解算法的准确性;并通过与并行优化前的有限元算法进行对比,获取优化后并行算法的加速比,结果表明该算法获得了较好的加速比和并行加速性能。
其他文献
在我国,烧结过程的能耗普遍较高,和国际先进水平相比存在一定差距,因此进一步降低烧结过程工序是国内烧结工作的重点之一,具有十分重要的现实意义。鉴于此,本论文以一钢烧结厂为研
PLA作为可降解的材料,是迄今为止研究最为广泛、应用范围最广的生物医用材料之一。但是长期的观察和研究发现PLA作为一种生物医用材料尚存在一些不足,尤其是临床方面。主要表现
二冷过程对连铸坯质量有很重要的影响。寻求合理的二冷制度是板坯连铸生产过程中所需解决的主要问题,以使不仅可以满足铸坯冷却的要求,并且能够保证铸坯质量。目前,通过计算
This study investigated the conversion of furfural to 5-hydroxymethylfurfural (HMF) and further to levulinic acid/ester in dimethoxymethane under acidic conditi
攀钢重轨钢还存在成分均匀性差、夹杂物难以得到控制等质量缺陷。为提高重轨钢的质量,实现成品轨含氢和夹杂物低、钢质均匀、机械性能达到国际标准,攀钢采用了结晶器电磁搅拌关
随着现代科学技术的发展和医学水平的提高,生物医学图像学作为生物学、医学和图像学的交叉学科,已日渐成为一门蓬勃发展并具有代表性的新型学科。医学成像技术的快速发展,涌现出
计算机技术及信息科学的发展促进了数字信号处理这一学科的发展,产生了许多新的理论、技术和算法。独立分量分析(Independent Component Analysis,ICA)算法,正是近十年来伴随
本文是针对40Cr和20CrMo钢的研究开发进行的,修正建立了棒材热连轧过程中的组织演变和力学性能的预测模型。轧制过程的计算模拟是以温度场模型、再结晶模型、相变模型和力学性
儿时走失农民工助她回家,筹办社工机构服务流动儿童rn2013年元宵节过后,福建省福州市闽侯区居民陈兰香看到女儿张洁仍没有返回广州上班的打算,便提醒她该订票了,不料张洁却告
期刊
桐乡以“文化之邦”著称,这里是中国现代文学巨匠茅盾、现代社会活动家金仲华、篆刻书法家钱君陶,以及摄影家徐肖冰等先辈的故乡。 Tongxiang is famous for “the state of