基于GPU加速的信号MP稀疏分解

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:slb135
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信号稀疏分解以其简洁、稀疏、灵活的优良特性成功的应用到信号处理的诸多方面中,成为信号处理研究的热点之一。匹配追踪算法实现简单、便于理解,在稀疏分解诸算法中算法复杂度最低,是信号稀疏分解中运用最广泛的算法。但即使这样,基于MP的信号稀疏分解依然面临分解速度慢、算法复杂度高、计算耗时长的问题。   与CPU相比,GPU对大量数据的处理能力更加出色。GPU的存储器带宽也较CPU更有优势。GPU为大量数据的运算提供了新的解决方案,特别是CUDA的提出,使GPU有向通用计算机发展的趋势。   针对CPU实现信号MP稀疏分解出现的问题,本文采用NVIDIA公司发布的统一运算设备架构CUDA来进行信号稀疏分解的GPU加速,提高信号稀疏分解的运算速度。   首先本文介绍了一维信号稀疏分解的基本原理,特别是基于MP的信号稀疏分解算法思想。接着阐述了NVIDIA公司的GPU产品CUDA,并从硬件和软件两方面介绍了CUDA编程模型、存储器模型、软件体系、执行模式等。   然后针对基于MP的信号稀疏分解分解速度慢的缺点,对其采用GPU进行加速来实现。在实现的过程中,本文提出了符合硬件特性的内积运算并行方案及改进方案。与CUDA库函数中的内积运算函数进行比较,内积并行方案的运算效率更出色。该方案成功应用到基于MP的信号稀疏分解中的原子能量运算、信号或其残差与冗余字典中原子的内积运算中。基于CUDA平台,本文对局部运算中冗余字典生成并行实现,提高了字典中原子的生成速度。实验表明,与CPU串行运算相比,在待分解信号长度为8192时,GPU实现基于MP的信号稀疏分解,加速比可达37.10倍。   最后针对GPU实现基于MP的信号稀疏分解存在冗余字典过大的问题,对基于FFT的信号MP稀疏分解算法采用GPU进行加速。在实现过程中,本文对冗余子字典、快速傅里叶变换及其反变换等局部运算进行GPU并行实现。同时本文提出的内积并行运算方案成功运用于字典中原子的能量计算中。实验表明,在待分解信号长度为16384时,GPU加速基于FFT的信号MP稀疏分解的速度是CPU串行实现的12.29倍。
其他文献
积液量的多少不仅是输气管道是否运行正常的参考依据,也是管道清管时的一个重要参数。积液量的测量方法可以分为直接测量法和间接测量法两大类。直接测量法具有测量精度高的
目前网络和通信技术应用已成为人们研究的热点,以太网以其简单、经济的优势得到了越来越广泛的应用。  以太网MAC层是以太网技术中的重要内容,主要实现数据调度和寻址的功能
随着技术的不断革新发展和人们生活水平的提高,网络技术已经由传统的互联网过渡到移动互联网时代,无线通信技术是其中的核心技术,人们对无线传输的带宽和效率提出了更高的需
在自由空间的条件下,现代数字信号处理技术在水声阵列信号处理中的应用已经逐渐成熟。但当这些信号处理技术应用在浅海波导的环境条件下时,性能会受到很大的影响,同时也可以结合
信息技术的高速发展和信息交换的日益频繁使得网络通信无处不在,却也为信号的安全传输带来了不容忽视的威胁,无线通信的广播特性使得它在信号传输所覆盖的领域中很容易受到窃听
学位
Cu(In,Ga)Se2(CIGS)是一种直接带隙材料,光吸收系数高达105数量级,是目前己知的光吸收性最好的半导体薄膜材料。利用一步法电沉积制备CIGS薄膜,设备投资少,可连续、大面积的沉积,
信息的有效采集与科学准确的数据重构是物联网前端传感层(简称WSN)的一项核心技术,同时也是具体物联网建设中,在节点硬件资源有限的条件下,实现大规模数据的有效采集、精简传输
码分多址技术具有容量大、覆盖范围广、功耗小等突出优点,但是所使用的扩频码一般非严格正交,非零互相关系数的存在会引起用户间的相互干扰,这些干扰分为小区内干扰和小区间
视频序列中目标跟踪是计算机视觉研究中的一个热点问题,它在医学诊断、天气情况分析、视频智能监控、视觉导航、军事制导等多方面都有非常好的前景应用。如何快速,准确的检测