GPU并行计算及其在光声图像重建中的应用

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:userlyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPU计算时代的到来,大量并行性的程序越来越多地使用GPU的并行计算能力来获得更高的性能和效率。如今,GPU并行计算使以前认为由于执行时间长而无法实现的程序成为可能。压缩感知光声计算机层析成像(compressed sensing-photoacoustic computed tomography,CS-PACT)是一种常用的医学图像重建方法,可以在稀疏采样的情况下生成高质量的图像。然而,由于CS-PACT是一个需要几十到几百次迭代的重建过程,计算复杂度高,使得图像重建过程非常慢。因此,为了提高图像重建速度,本文将GPU应用到光声图像重建中,重点探索了CS-PACT算法的GPU并行计算框架和计算方法。本文的主要研究内容如下:(1)小图像尺寸下的GPU并行计算模型和方法。本文提出了迭代重建算法的GPU并行计算架构,主要是提取了5类主要的并行化算子,然后对其进行并行设计,并运用优化方法对其优化。最后通过两个不同的人手数据(128*128,256*128)进行定性与定量分析,来证明GPU重建图像的准确性。对于128*128(像素)人手1的B-scan光声图像实现了1.9-2.5s的图像重建速度,比CPU性能快24-31倍。对于256*128的人手2的B-scan光声图像实现了5s-8s的图像重建速度,比CPU性能快26-28倍。(2)大图像尺寸下的GPU并行计算模型和方法。在对大图像进行重建的过程中,测量矩阵K造成内存溢出,无法对图像进行重建。针对这个问题,本文提出了基于CUDA流的GPU并行计算架构,将大块图像分成多块小图像,采用CUDA流对小块图像进行光声重建。针对每一小块图像的光声重建,本文分析并设计具体的核函数来实现,然后通过仿体插针实验和小老鼠实验来证明GPU重建图像的准确性以及与CPU相比性能加速效果,对于仿体插针实验实现了与CPU相比37倍的加速,并测出在使用不同CUDA流数目下,小块图像的重建时间,证明了使用CUDA流可以实现运算加速,对于小老鼠实验实现了38-42倍的加速。
其他文献
癌症是发达国家第二大死亡原因,如果癌症患者在早期阶段,得到了有效的干预治疗,可以最大程度地提高存活率,因此实现癌症的早期诊断意义重大。癌胚抗原(CEA)被认为是最重要的
在云南蒙自县采访,大家都不约而同地谈到了石榴。一个小小的产业如何成为大家口中的城市名片呢?$$ 当记者来到蒙自,看见了万亩连片的石榴园,了解到这个产业让老百姓一亩地
报纸
在工程领域,有限元模型被广泛地应用于基于模型的实际工程问题分析与研究工作中,一个能真实反映结构运营后服役状态的有限元模型至关重要。桥梁真实的工作状态(结构施工质量
自主行驶移动平台又称无人平台,是地面移动机器人的一种形式。即时定位与地图构建(Simultaneous Localization and Mapping,SLAM)可以使移动机器人等无人平台进行自身定位同
在当今世界,煤炭需求在所有能源需求中仍然处于前列,煤矿的安全开采是关乎到国计民生的重大课题。在煤矿安全事故中占比例较大的是顶板事故,其原因多为设备监测不完善,顶板支
光致电化学(PEC)生物传感器是近年发展起来的一种生物分子检测技术,具有设备简单、灵敏度高、背景信号低等优点,已迅速成为当下的研究热点。研究表明,传感器响应信号的产生主要
随着我国经济的飞速增长,人们的生活已达到小康水平,与此同时,青少年的身体健康状况也引起了人们的广泛关注。另外,二胎政策的开放,我国青少年人口随之急剧增加,青少年的身体
同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)是一种优秀的空间信息分析处理技术,为移动机器人实现自主规划运动助益良多。近年来,其中的分支—视觉SLAM
微游动机器人的外形尺寸一般在亚微米到微米级别,可在液体环境中将多种驱动能源转化成受控的机械运动。随着微纳米技术的发展,微游动机器人已经逐渐应用于生化传递、生物传感
六维力传感器目前已广泛应用于工程实践,尤其是航天领域,在从事在轨修复等精密作业时,需要用灵巧手完成一些复杂的操作,在灵巧手上安装六维力传感器可以实现对接触点的精准力