基于GPU的MUSIC算法的高效实现

来源 :扬州大学 | 被引量 : 0次 | 上传用户:wjg12322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今电子侦察的情形下,相应的电磁场环境是令人难以捉摸的,传统的测向技术已经不能满足人们对于测向技术日益增长的需求。因此,拥有强大测向分辨能力和高精度能力的空间谱估计测向技术开始慢慢取代了传统的测向技术。在空间谱估计测向技术中比较典型的算法之一就是MUSIC算法,空间谱估计算法能够得到快速推广离不开MUSIC算法的帮助。当然,MUSIC算法也存在一些弊端,比如,MUSIC算法中的矩阵变换频繁,而且也不能对数据进行即时处理。因此,人们为了能够让MUSIC算法实现最大化的使用效率,进行了很多关于MUSIC算法的高效实现的方法研究。本文分析了 MUSIC算法在实现中遇到的瓶颈问题并根据MUSIC算法的基本特征对其性能进行详细分析和优化,采用并行处理的方式对算法进行改进,结合具备优异并行处理能力的硬件平台GPU,将MUSIC算法在CPU+GPU平台上联合实现。最后,把MUSIC算法优化前后的时间以及运算效率通过加速比和并行效率的数值进行比较与分析,最大程度上实现了 MUSIC算法的效率的优化。本文的主要内容如下:1.根据MUSIC算法的基本原理和基本流程,制定了 MUSIC算法初步的改进方案。在这个初步改进方案的基础上,选取9元阵空间谱作为本文的研究对象,结合9元阵空间谱运算的总时间和各个主要部分所占总时间的比例,分析MUSIC算法在运算过程中的一些瓶颈问题。2.算法性能提升离不开硬件平台,本文论述了硬件平台FPGA,FPGA+DSP和GPU三种不同平台上实现MUSIC算法的优势和弊端,根据GPU平台内部结构及其加速原理等其他平台不可取代的优点,最终选取具有优异并行能力的GPU平台作为MUSIC算法的硬件平台。3.利用一个重要的框架—基于GPU平台的CUDA框架,CUDA框架协同处理的异构模式以及CUDA独特的存储模型和编程模式能够给MUSIC算法的优化带来极大便利。根据CUDA框架的优点将MUSIC算法的从CPU平台中Matlab语言环境中移植到CPU+GPU平台上,以CUDA框架为基础的C语言环境中进行运算,利用加速比和并行效率对MUSIC算法初步优化前后的性能进行分析。4.根据MUSIC算法的时间资源以及瓶颈问题的分析,讨论关于MUSIC算法优化方案。首先通过MUSIC算法的运算过程中的时间资源情况中了解SVD中矩阵的计算量巨大,分析SVD中可以并行的部分,采用并行运算的方式进行计算来提高计算效率。然后分析此算法中寄存器的使用情况,通过合理分配寄存器来减少数据之间不必要的交互从而提高算法的加速比。最后,查找算法中能够组成流操作的部分,即将一些分散的操作整合为一个流,接着可以将多个流进行异步并行实现,最终再分析算法的性能。通过上述三个不同阶段的优化之后,最终对MUSIC算法的性能进行总体比较分析,通过将优化前后MUSIC算法的运行时间,加速比和并行效率的数值进行比较,分析MUSIC算法的性能提升情况。
其他文献
不少年轻的朋友都在交流时使用火星文,最方便的工具自然是兼容所有文字输入方案的“火星文输入法”了,其实我们还可以让火星文变得更加生动与炫酷。
作者从室内微环境生态平衡的构成及其打破这种平衡因素出发,探讨室内微环境生态平衡对人体健康的重要性,并进而指出:为了减少疾病的发病率,就应从改善室内微环境生态平衡做起,这也
研究了基于RED控制的单一TCP网络的离散反馈系统模型,采用解析及数值方法分析了不同系统参数下TCP-RED工作点及其稳定性,借助分岔图讨论了不同RED参数的变化对网络系统特性的
通常情况下对分布族进行扩展,可以增加指数分布族在应用上的灵活性,这一过程在许多国内外的文献中都有所涉及。在扩展分布族的研究中,学者Marshall和Olkin提出一种扩展分布族
西成高铁的开通打破了川陕两省的地理壁垒,有效地汇聚川渝地区与西北地区的人力、信息、资源、科技等多方面优势,形成区域经济协调发展的新战略平台,西三角城市群的研究将重返人们的视野之中。对于西三角的研究极具战略意义,西三角城市群的形成将成为西部大开发战略的重要着力点,能有效实现区域均衡。当下,高速铁路大规模的建设和运营为我国城市群空间格局发展带来重要机遇。高铁建设通过提高城市间通达性,改善城市的区位条件
经济高速发展的今天,航运业对经济发展举足轻重。船舶在航行过程中需要消耗大量的淡水来满足船上人员和设备的需求,特别是大型远洋邮轮的淡水需求问题更为突出。从陆地上携带淡水的方式无法满足船舶用水的需求,大多数船舶都配备有海水淡化装置。热法海水淡化是一种能够有效利用船舶余热制取淡水的方法,本文针对带有蒸汽喷射器的船用低温热法海水淡化系统进行了理论分析和实验研究。主要研究工作包括:首先,根据船舶柴油机缸套水
近日,网上出现关于AMD新版Phenom ⅡX3 710、Phenom ⅡX3 720产品可通过主板BIOS打开被屏蔽的核心,变身为四核产品的消息。经过《电脑迷》与各家厂商沟通后得到了厂商们的确认:
电子信息产业对高性能介质电容的需求与日俱增,器件的微型化和植入化要求其同时具有良好的介电性能和较高的耐电压强度。开发该类器件的关键是获得高性能介质材料体系和高效的制备方法。同时,基于环保和安全的考虑,非铅体系是现在以及未来的研发重点。因此,本研究以钛酸锶钡(Ba0.7Sr0.3TiO3,BST)为基础材料,放电等离子烧结(SPS)技术为陶瓷介质合成方法,通过调节前驱粉体的制备方式、A/B位共掺杂改
本文通过对集对分析综合评价系统的软件开发,研制的过程,软件结构的组成及软件处理方法的论述,全面地,介绍了集对分析教学评价的软件系统特点及应用方法。
光力效应源自于光与物质相互作用过程中的动量交换,利用这种力学效应人们开发了能够在无接触和无损活体条件下对纳米至微米尺度微粒实施稳定捕获和灵活操控的光镊技术。光镊技术使得人们对微小物体的研究从被动的观察转为主动的观测,在生物学、物理学、化学等领域均有着重要的广泛应用。然而,传统光镊系统中使用的捕获光源均为标量光场,在捕获范围和势阱深度等方面限制了光镊技术对特定种类粒子的捕获效率。随着激光技术的飞速发