论文部分内容阅读
光学分子成像作为一种迅速发展的医学影像技术,由于具有无创性、高灵敏度、高时间分辨率、成像价格低等优点而得到了广泛重视和应用,近年来已经成为了影像领域的研究热点。在光学分子成像领域中,光子在生物组织中传输过程的精确建模与快速求解具有重要的研究意义。本文围绕生物组织中光传输问题展开研究,通过详尽地分析各种光传输前向模型,特别是简化球谐波模型(simplifiedspherical harmonics,SPN)的特点,针对该模型的数值求解方法进行了深入的研究,并探讨了有限元数值求解方法移植到图形处理器(graphics processing unit,GPU)并行执行的可行性。对于多维复杂几何结构,随着近似阶数N的增大,SPN模型将会面临计算量较大的问题。同时考虑有限元算法作为一种离散化近似求解的数值方法,具有天然的可并行性。因此,本文提出了一种基于GPU高性能计算的并行有限元算法,用于加速求解基于SPN方程的光传输过程。本方法采用由NVIDIA公司推出的通用并行计算框架——统一计算设备架构(compute unified device architecture,CUDA)作为并行计算解决方案,使其求解结果能够在确保较高精度的同时,又缩短了大量的计算时间。在充分考虑CUDA平台GPU的硬件特点后,本文又对有限元算法程序中计算量较大的线性方程组求解部分进行了相应的算法优化设计,包括精简优化GPU核心函数代码和对程序结构、存储器、数据通信进行合理优化,充分利用GPU资源,进一步提高并行加速性能。通过与蒙特卡罗仿真结果对比,验证了基于CUDA并行框架的SPN快速求解算法的准确性;并通过与并行优化前的有限元算法进行对比,获取优化后并行算法的加速比,结果表明该算法获得了较好的加速比和并行加速性能。