基于CPU+GPU的影像匹配高效能异构并行计算研究

被引量 : 97次 | 上传用户:woaifulei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核CPU和图形处理器(Graphic Processing Unit, GPU)的高速发展,不但促进了图像处理、虚拟现实、计算机仿真等领域的快速发展,同时也为利用GPU进行图形处理以外的高性价比绿色通用计算提供了良好的运行平台。因此,GPU的通用计算己成为高性能计算领域中的热点研究课题之一。伴随着传感器技术的不断进步,致使人们获取地表信息的手段越来越多样快捷。面对数据源的多样化与数据量的成倍增长,许多常规算法很难满足对海量数据进行高速计算的要求。而现代图形硬件GPU日益增加的可编程性和高效能计算能力,则为摄影测量与遥感中可并行化算法的加速提供很大的空间。本文仅就GPU大规模并行计算影像匹配研究中的若干问题进行了详细的分析,并提出了相应的解决方案。具体工作概述如下:(1)通过对摄影测量与遥感领域中与影像匹配处理相关的四种算法在GPU上的并行处理进行研究,提出了基于CPU+GPU的异构群核架构的影像处理共通解决方案,探索了影像处理的GPU大规模并行计算设计模式。基于GPU的影像处理通用并行解决方案要在数据精度、延迟和计算量等几个方面进行GPU加速效果的预评估,算法设计和优化过程中也须采用功能和数据分解、线程映射等并行计算方法以及存储器访问优化、通信优化和指令流优化等优化策略。基于GPU的影像处理通用解决方案设计与性能优化是与GPU的体系结构、求解问题的特征结合在一起的,通常需要多重因素整体考虑并不断尝试,最终达到理想的性能。针对GPU与CPU的不同,重点分析和讨论了GPU的加速原理以及当前比较成熟的统一计算设备架构(Compute Unified Device Architecture, CUDA)通用计算模型构架及其特点。(2)提出多GPUs加速的Wallis变换影像增强并行算法。借助于GPU较强的运算能力,利用CUDA并行计算架构在个人计算机(Personal Computer, PC)上实现了快速Wallis图像滤波算法,包括GPU上任务分解、大规模计算核心的分解方法,结合使用了共享存储器、全局存储器对算法进行加速。使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题。对比CPU和GPU计算Wallis影像变换的时间,实验结果表明,Wallis变换并行算法可以把计算速度提高2个数量级。该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少计算时间。(3)研究基于GPU的Harris角点检测多设备控制并行算法,使用众多线程将计算中耗时的图像高斯卷积平滑滤波部分改造成单指令多线程(Single Instruction Multiple Thread, SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在CUDA上完成图像角点检测的全过程。实验结果表明,基于多GPUs的Harris角点检测并行算法成功实现了硬件加速,相对于CPU上运行的Harris角点检测算法,其执行效率有近60倍的提高。(4)提出基于CUDA架构的快速相关系数影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法系根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化了数据存储结构,提高了数据访问效率。实验结果表明,并行算法充分利用了GPU的并行处理能力,速度是基于CPU实现的近20倍并能获得最高多处理器warp占有率。(5)研究面向CPU+GPU群核架构的尺度不变特征变换(Scale Invariant Feature Transform, SIFT)特征匹配并行算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,与SIFT特征匹配的串行CPU实现方式相比,CUDA实现能够实现超过27倍的性能加速,极大地提高了SIFT特征匹配算法在实际应用中的实时性。(6)基于CPU+GPU的影像匹配系统集成研究。包括单GPU/多GPUs加速的Wallis-Harris-相关系数(WHR)影像匹配系统和单GPU/多GPUs加速的Wallis-SIFT(WS)影像匹配系统。实验结果表明,GPU加速的WHR影像匹配系统比CPU实现方法整体提速最高达37倍,GPU加速的WS影像匹配系统比CPU实现方法整体提速最高达39倍。
其他文献
在第一届中国城市森林论坛中倡导的“让森林走进城市,让城市拥抱森林”已成为保护城市生态环境,提升城市形象和综合竞争力,推动区域经济持续健康发展的新理念。由于城市森林
理想的根管充填材料应该具有易操作、X线阻射、体积稳定、不易被吸收、能黏附于牙本质、封闭性.好、无毒、生物相容性好和骨诱导等特点。由于根管充填材料。_.与根尖周组织可
宫殿建筑代表中国古代建筑的最高成就,它包括了行政、居住、祭祀、教育等多种功能,它综合了各类中国传统建筑的精华部分,同时也是中国其它传统建筑的范本,集中体现了中国传统
随着相同价位、档次的房地产商品不断在市场上出现,房地产广告设计如何使消费者对房地产商品消费有冲动、有欲望,关键是要通过研究不同的个性差异而做出不同的关怀。
诉讼标的理论是诉讼法学体系中最基础的理论之一,其横跨实体法领域与程序法领域,是连接实体法与诉讼法的桥梁。在司法实务中,诉讼标的作为法院审理和判决的客体,是判断当事人
外语早读如能从一开始就做到有计划、有目的、有安排,并持之以恒,一定能收到良好的教学效果。
<正>2007年11月5日,中美两国防长正式宣布将建立中美国防部直通电话,这不仅是中国人民解放军与外军建立的第一条高层军事热线,也标志着中美在军事安全领域的合作迈出了重要一
期刊
以配网调度技术支持系统建设工程为背景,以配网调度运行管理工作业务需求为目标,提出了面向业务驱动的配网专题图自动生成方法。该方法基于实时电网状态通过拓扑服务动态抽取
本文主要论述了农学专业英语的特点,并结合这些特点总结了常用的农学英语文章翻译原则,然后提出了如何正确的翻译农学英语的策略,并最终能达到能准确、客观、精练翻译农学英
基于机器视觉的喷药机器人杂草识别与导航参数获取方法研究,对定点变量投放化学药剂以降低对生态环境的污染,对农业机械自主或辅助定位导航以实现精确农田作业,均具有重要的