W-PROJECTION并行算法优化研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zsxzsx1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着平方公里阵(square kilometer array,SKA)等大型综合孔径射电望远镜的建设,基线长度和观测视场不断增加。为了提高成像质量需考虑大视场和非共面基线效应的影响。w-projection作为处理大视场成像与非共面基线效应的重要算法具有优越的计算速度和误差控制,但算法投影过程复杂、内存消耗较大,同时面临海量的天文观测数据,因此需要提高算法的并行效率。本文在成像质量和算法并行效率两个方面对算法进行优化,针对并行优化方法在CUDA下编程实现并优化性能,具体研究工作如下:(1)w-projection和w-stacking算法中w-plane的取值决定了卷积核的数量,对算法的成像质量具有重要影响。原有的w-plane经验取值不能很好的完成大视场成像,因此通过对w-plane的取值进行实验统计分析得到w-plane最优经验值以提高算法的成像质量。(2)w-projection算法计算复杂并且需要处理海量的观测数据,因此将算法移植到GPU下以提高算法并行效率。针对目前算法在GPU上实现存在的问题,分别在内存分配、线程数量和线程块中寄存器的使用量等方面进行优化,然后根据新的设计方法在CUDA平台进行编程实现,有效的提高了算法的并行效率。(3)w-projection算法在CUDA平台下的实现需要对算法性能进行优化。通过应用w-plane最优经验值对CUDA平台下算法的数据分块tile大小和分块比例进行实验分析,得到适合处理SKA1-low望远镜观测数据的分块大小,提高了并行算法的性能。本文的研究成果:(1)在分析w-plane对w-projection算法处理速度和成像质量影响的过程中得到w-plane的最优经验值,提高了算法的成图质量;(2)针对现有的GPU算法在实现方面存在的问题,对GPU设备内存、线程数量和线程块中寄存器的使用量等方面做了改进并编程实现;(3)对算法的CUDA代码实现中的运行性能进行优化,通过实验分析得到针对SKA1-low望远镜的最优tile分块大小,有效提高SKA1-low望远镜的数据并行处理速度与质量。
其他文献
3月20日下午,由恒大材料公司主办、三棵树涂料股份有限公司协办的第一批恒大战略合作伙伴区域交流会在福建莆田召开。广东博德精一建材有限公司(以下简称博德)营销副总经理陈海
目的探讨白内障超声乳化术中后囊破裂的原因及处理技巧.方法对43例(44眼)超声乳化术中后囊破裂原因分析:主要与撕囊、碎核、清除皮质等法有关.采用Healon回压保护破口,剪刀-
本刊讯 7月13日,南佛山市陶瓷行业协会主办,中国建材检验认证集团绿色产品院和佛山市南海区广工大数控装备协同创新研究院承办的绿色建材贯标暨精益管理培训会议和佛山市广工大
【正】腹部损伤是急诊外科常见的急腹症之一,病情重,变化快,易漏诊、误诊,直接威胁病人生命,我院于1994~1997年共治腹部损伤194例,现将临床诊治体会报道如下.1 临床资料1.1 一
利用稀土直接掺杂工艺合成了一种“常光充能”型电子陷获材料CaS∶Eu,Sm,它不仅具有CaS∶Eu无机发光材料的荧光光谱特性,而且具有红外升频转换特性,可将0.8~1.6μm的红外光直接转
本文提出了一种两维光测条纹图的相位测量技术--阶梯莆虚光栅解调算法,此法只需要获取一幅光载波条纹图,由计算机产生两个由N(整数)个象素构成、透射函数呈阶梯形分布、彼此间有一定
目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性三角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性三角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性三角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性三角系统求
研究背景与目的:梗阻性黄疸可导致肝脏以及全身各系统的一系列病理生理改变,损伤肝脏功能,增加手术风险;胆道引流可以解除胆管的梗阻状态,恢复肝脏功能。但是胆道引流的效果在不同患者之间存在很大差异,是什么原因造成了这种差异,目前仍没有完善的解释。对梗阻性黄疸患者在手术前应用胆道引流进行术前减黄,曾经一度被肝胆外科界大力推崇,然而近年来有大量的临床研究对术前减黄提出了质疑,认为它并没有使患者从中获益。这其