论文部分内容阅读
通过对CUDA(Compute Unified Device Architecture,即计算统一设备架构的简称)系列文章第一部分和第二部分的阅读,您现在已经可以创建和运行在支持CUDA的设备上使用成百上千同步线程的程序。在第二部分的incrementArrays.cu中,我提供了一个常见的CUDA应用程序模式的工作示例——将数据移动到设备,运行一个或多个内核以进行计算并获得结果。本质上,只需使用您自己的内核并加载自己的数据(我在本篇专栏文章的示例中就是这样做的)就可以将incrementArrays.c