论文部分内容阅读
近年来,GPU(Graphic Processing Unit)并行计算的性能不断提升,越来越多的被应用于通用计算领域,这其中包括通信领域。OpenCL (Open Computing Language)是一个为异构计算设计的通用架构和行业标准,广泛适应于GPU、DSP(Digital Signal Processor)等并行处理器。信道模型的仿真是通信系统仿真最耗时的模块之一,本论文基于OpenCL在GPU上对信道模型的仿真加速进行研究。信道模型主要包括信道系数产生、高斯随机数产生、输入信号过信道滤波三部分,本论文对常用的Jakes模型和SCM(Spatial Channel Model)空间信道模型进行并行仿真研究,目前OpenCL并没有提供产生随机数的库函数,因此本文主要解决高斯随机数产生和信道系数产生两个关键问题。首先,本论文分析了OpenCL架构和优化技术,并基于OpenCL测试了实验环境中的GTX660GPU的传输带宽、计算能力等性能,对后续的优化研究提供了指导。其次,研究了高斯随机数发生器,推导并实现了同余法与梅森旋转法的并行算法,给出了GPU产生随机数的统计特性与时间性能,GPU并行实现相比CPU(Central Processing Unit)上的函数加速了30到150倍。然后,研究了信道模型的仿真原理与并行性,实现了并行信道系数产生模块,结合并行随机数发生器实现了信号过信道的滤波模块。并且采用静态线程、全局内存合并访问、局部内存缓存、矢量计算、异步执行等方法优化了各个模块。最后,给出了基于GTX660的Jakes信道模型与SCM信道模型GPU仿真结果的分布统计图和时间统计图。研究结果表明,基于GPU的信道模型在LTE (Long Term Evolution)系统配置条件下可以实现实时的仿真,即使对较复杂的SCM模型30.72MHz采样率,2x2的MIMO(Multi-input Multi-output)信道,中等性能的GTX660GPU仿真1个子帧对应的信道所需要的内核总执行时间约为0.93584ms,小于lms。随着3D/Massive MIMO等技术的引进,信道模型将更复杂,本文对于信道模型仿真加速具有重大的实践意义。