基于GPU的多帧信号的FFT并行实现

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:yl198710310318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 随着信息科学技术的发展,快速傅里叶变换已成为当今极其重要的学科和技术领域之一,得到了广泛应用,而GPU强大的浮点计算能力和数据并行处理能力,在数字信号处理等方面得到了越来越多的应用,也带来了很大的加速比。
  关键词 GPU FFT 并行
  中图分类号 TP3 文献标识码 A
  0 引 言 快速傅里叶变换(FFT)是离散傅里叶变换(DFT)的快速算法,现已成为数字信号处理的强有力工具。计算机图形处理器(Graphics Processing Unit,GPU)是指一个单芯片的处理器,近年来,随着GPU可编程性的不断提高,利用GPU来完成图形渲染以外的通用计算得到了越来越多的应用。
  1 GPU的发展概况
  计算机图形处理器(Graphics Processing Unit,GPU)是指一个单芯片的处理器,近年来,随着GPU可编程性的不断提高,利用GPU来完成图形渲染以外的通用计算得到了越来越多的应用,众多运算密集型的应用程序执行速度已经可以通过NVIDIA的GPU产品获得令人瞩目的提升。
  2 快速傅里叶变换(FFT)
  快速傅里叶变换(FFT)是计算离散傅里叶变换(DFT)的快速算法,直接计算有限长为的序列的DFT的公式为:
  (1.1)
  其逆变换为: (1.2)
  其中: (1.3)
  (1.4)
  3 多帧信号的FFT在GPU的并行实现
  目前,NVIDIA公司生产的CUDA软件包中集成了标准的傅立叶变换库——CUFFT,为科研人员提供了方便。使用CUFFT库的过程如下:
  1.建立cufftHandle类型的对象,将数据拷贝到显存;
  2.选择FFT使用的对象,根据自己需要确定使用哪一个函数,本文选择的复数转向复数型的多帧信号一维FFT变换,采用的是cufftExecC2C类型的函数。
  3.完成变换,将变换后的数据拷贝回内存。
  系统测试环境如下表1所示
  表1 系统测试环境
  4 试验结果与分析比较
  表2分别为不同长度的信号和不同帧的数量时,多帧信号的一维FFT的GPU并行计算结果时间和MATLAB计算结果,其中每次结果都是系统运行10次以上测量取平均值的结果。同时将随机一帧的结果的精度给出表格3。为了明显看出结果,将表3中的数据取了10倍的对数取其数据制成图1,同时把加速比的比值直接绘制成下图2所示。
  表2 多帧信号的一维FFT运算时间(单位:ms)
  表3 GPU和MATLAB运算一维FFT的精度
  根据上述试验测试显示,多帧信号在并行计算一维FFT时,在CPU和在GPU上的运行速度是有着明显不同效果的,当帧数和信号长度较小时,其运算速度没有较大的提高,这是因为数据在内存和显存之间的拷贝时间占据了较长的时间,内存的延迟得不到很好的隐藏,但是随着帧数和信号长度的增加,在GPU上运行速度明显提高,其加速比甚至达到了数千倍乃至万倍的提高,这是因为随着长度和帧数的增加,GPU和CPU之间拷贝的时间变化的不是很明显。
  参 考 文 献
  [1] NVIDIA CUDA 编程指南版本4.0.
  [2] 杨晓玲. 基于GPU的LBM方法计算研究[D]. 上海: 上海大学, 2008.
  [3] 王海华. 基于GPU的合成孔径雷达回波仿真技术研究[D]. 成都: 电子科技大学, 2009.
  [4] 韩博, 周秉锋. GPGPU性能模型及应用实例分析. 计算机辅助设计与图形学学报, 2009.09.
  [5] 张舒, 褚艳丽, 赵开勇, 张钰勃. GPU高性能运算之CUDA[M]. 北京: 中国水利水电出版社, 2009.
其他文献
摘要:燕家河煤矿回风下山由于受围岩蠕变特性、动压等因素影响,巷道出现了较大变形甚至破坏。在分析回风下山变形特征的基础上,采用全断面锚注联合加固技术对回风下山破坏较严重段进行了修复加固,有效控制围岩变形与破坏。  关键词:锚注;巷道加固;锚索束;回风下山  中图分类号:TD353  Abstract: Due to the surrounding rock creep properties and
期刊
[摘 要]本文通过调查中职学校实验设备的现状,分析虚拟现实技术的应用,提出建立一套基于虚拟现实技术的实验教学的新方案,从而减少硬件设备的更新换代,使学生能够感受虚拟现实实验室的效果,帮助学生加强对所学知识的掌握,并将该技术的研究应用到中职学校各专业实验课程体系项目中。  [关键词]中职 虚拟现实 技术 教学  中图分类号:G712 文献标识码:A 文章编号:1009-914X(2013)16-02
期刊
摘要:本文以安庆四万八空分装置为例,主要介绍了一拖二大型空压机组的复杂控制方案,着重阐述了机组防喘振控制、性能调节及入口导叶自动跟踪控制功能。  关键词:一拖二压缩机组;防喘振控制;性能调节;入口导叶;自动跟踪。  中图分类号:TH45  1. 前言  一拖二压缩机组,是由一台双输出的汽轮机驱动两台压缩机组,这种设计为用户合理安排设备空间、方便了设备的安装、运行及维护等,从而节约了成本投入,所以深
期刊
[摘 要]本文浅谈特厚燃易燃煤层水平布置巷道无煤柱开采技术。  [关键词]易燃、煤层、巷道、无煤柱  中图分类号:TU185 文献标识码:A 文章编号:1009-914X(2013)16-0240-01  1 提出无煤柱开采的技术依据  1983年首先在—50北18层采区提出水平布置巷道无煤柱开采,主要技术依据有以下四点:  1.1 受上分段巷遭布置的影响  上分段(+15水平18层)采区巷道布置
期刊
[摘要]结合低压CO2装置制冷系统设计的实际工作,通过对制冷系统在实际应用时存在的问题进行分析、探讨,提出了相应的解决措施达到优化、提高产品性能的目的。  [关键词]灭火及惰化、低温低压贮存、制冷系统、蒸发器、冷量交换  中图分类号:TJ53+3  1.前言  低压二氧化碳灭火系统以其储存量大,占地面积小的特点,在大型消防工程应用领域占据了首要的地位,在电厂设备间、钢厂、珍贵资料库房等的灭火已得到
期刊
[摘 要]目前油田新投区块及老区改造地区地面集输多采用环状、支状流程,单井计量主要采用功图法计产,本文对比功图法计量方式与玻璃管计量方式的测试结果,分析功图计量误差原因,研究表明在产液量小于10t井上,功图计产结果误差较大,在稠油结蜡严重的敖南区块功图计产测试结果偏高。低产井功图计产方式需采取移动计量设备合理标定。  [关键词]功图法;产液量;玻璃管;适应性  中图分类号:TE328 文献标识码:
期刊
摘要 针对300MW级机组工程,对凝结水泵的选型在技术、节电各方面进行分析对比,为凝结水泵的选择提供依据。  关键词 凝结水泵 控制方式 内馈调速 变频调速  中图分类号:TM621  引言  现在常规300MW级火电厂中,凝结水系统的主流程是从排汽联合装置下部凝结水箱引出经凝结水泵、凝结水精处理装置、汽机轴封加热器、三台低压加热器送至除氧器。凝结水系统中的重要设备—凝结水泵的选择对整个机组运行情
期刊
摘 要 煤加压气化废水的综合治理及零排放是工业废水处理的难点,也是广大学者研究的热点。活性焦对煤加压气化废水中高浓度、难降解有机物有一定的吸附和脱除作用,已经得到国内学者的实验性证实。本文阐述了煤加压气化废水的特点、处理方法及活性焦的相关基础知识。重点阐述了活性焦在煤加压气化废水深度处理段的工程应用。  关键词 活性焦,煤加压气化废水,吸附技术,深度处理  中图分类号:X703  我国煤炭储量相对
期刊
摘要:锅炉设计煤种是锅炉及其辅机系统进行设计和选型最重要的依据和基础。从多个方面论述煤质对锅炉运行的影响,并据此阐述相应的应对措施。  关键词:煤质,锅炉,措施  中图分类号:P618.11  引言  众所周知,锅炉的设计计算(主要指保证参数—蒸发量、压力、温度等)是根据给定的煤种来进行总体结构、受热面布置和燃烧设备的选配的。因此当煤种变化时,不仅将影响锅炉的热效率,而且锅炉的主要性能指标—蒸发量
期刊
摘要:提出隔膜压缩机油路故障现象和原因分析,并对上述现象提出对策和预防措施.  关键词: 隔膜压缩机;溢流阀;补偿泵;回油  中图分类号:TH45  由于隔膜式压缩机具有余隙容积小、无污染和冷却效果好等特点, 并且在小流量、高压无油润滑的工艺条件下对工艺气体无污染,特别适合于易燃易爆、有毒有害介质,因此在小流量的增压系统中应用比较广泛。高压低密度聚乙烯装置采用往复式隔膜压缩机,为反应器提供引发剂氧
期刊