论文部分内容阅读
基于CPU和GPU对传统图像灰度相关系数匹配算法的加速原理,并在原有的加速算法的基础上,提出一种更高效的GPU并行算法.该算法用一种更高效的分块方式实现CUDA的两层并行,充分利用高速存储器,解决了过多访问硬件中低速存储器而造成的时间延迟问题,大幅提高效率.实验表明在目前主流软硬件条件下,时间相较CPU算法平均加速48倍,相较原有GPU并行算法加速7~12倍.改进后的算法对于图像尺寸、数量的增大有较强的适应性,同时也非常适合通过多设备、设备集群的方式将其进行更加高速的并行处理,解决今后的海量图像匹配应用.