论文部分内容阅读
现代社会与经济的发展对运算密集型的应用程序执行速度有着越来越高的要求。而单核CPU的运算频率由于受硅材料的物理限制,主频已不可能大幅提高;尽管近年来一些多核CPU的出现提升了运算能力,但是受于CPU通用性的要求,并不能使之适合于大规模的并行数据计算,即无法使全部CPU内核阵列同步并且协调运算。以前传统的解决方法是采用服务器集群运算,但是存在的缺点是价格昂贵,体积巨大。因此,一些公司借鉴GPU(图形处理器)的强大浮点处理能力,更新了GPU的架构,使之能够适应通用编程操作,最新的解决方案以NVIDIA公司提出的CUDA架构为代表,本文简单介绍并探讨了CUDA并行运算的架构与特点。