基于CPU+GPU异构信号处理平台多任务调度技术的研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:bole456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,信号处理领域实时性要求越来越高,采用CPU+GPU架构的高性能处理平台逐渐在信号处理领域受到重视。为了有效发挥平台内部CPU和GPU计算资源的效率,需要任务调度算法与平台的硬件特点相匹配。然而对于CPU+GPU异构信号处理平台,传统调度算法由于CPU+GPU架构的特殊性,无法发挥优势,甚至造成负面影响。课题由此研究改进了适合于CPU+GPU异构信号处理平台的任务调度决策与方法,实现了对平台多种并行计算资源的有效管理和利用。论文中的主要工作如下:1.针对现有调度算法在调度时无法根据CPU+GPU异构信号处理平台上的硬件特点分配计算任务的问题,提出了基于CPU+GPU异构信号处理平台的负载部署决策(Load Deployment Decision,LDD)算法。其在经典列表算法——HEFT的基础上进行改良,引入了负载部署决策,事先已将不适合在GPU上执行的任务划分给CPU,使GPU强大的并行计算优势得以充分发挥,避免了让GPU处理计算量小的任务,也让CPU参与到了并行计算中来。仿真实验结果表明,LDD算法有效地提高了CPU+GPU异构信号处理平台上多处理器的利用率,规范了任务的执行顺序,使得整体调度时间更短,负载更加均衡,达到改善调度的目的。2.针对现有调度算法无法解决异构信号处理平台上各类处理器之间的传输限制的问题,提出了面向异构信号处理平台的最长路径列表调度(Longest Path List Scheduling,LPLS)算法。算法在任务优先级阶段,基于最长路径列表计算优先级,使得最耗时路径上的任务被优先调度;在处理器选择阶段,遵循任务的最早完成时间与其后续任务到出口任务的最长路径之和最小的原则选择处理器,使得异构平台整体处理时间更小。仿真实验结果表明,相比于经典的HEFT算法,LPLS算法是一种负载更加均衡的算法,具有调度长度更短、效率更高等优势。3.为了进一步提升CPU+GPU异构信号处理平台的任务调度能力,将LDD算法以及LPLS算法融合为一,形成了适合于CPU+GPU异构信号处理平台的多核并行调度(MultiCore Parallel Scheduling,MCPS)算法。通过对PTS-MUSIC算法进行调度加速,从而验证了MCPS算法在CPU+GPU异构信号处理平台上不仅提高了处理器并行资源的利用率,还加速了信号数据的处理,较大程度地缩短了PTS-MUSIC算法的处理时间。
其他文献
毫米波功率模块(Millimeter Wave Power Module,MMPM)是一种新型的工作在毫米波波段的微波功率放大器件,主要由毫米波小型化行波管、固态放大器及集成电源三大部分组成,具有体积小、重量轻、效率高、频率高、频带宽等优点。随着MMPM小型化水平的提高,温度过高和热量分布不均匀成为了制约其可靠性的关键因素。基于此开展MMPM的热设计研究工作,对于提高MMPM的可靠性具有重要的意义
短波通信是一种有效的无中继长距离传输无线通信手段,因其抗毁、抗干扰能力强、配置灵活、成本较低等优点,广泛应用于军事通信。随着近几十年产生了许多短波自适应通信链路标准,短波通信的稳定性和有效性显著提高。其中,美国国防部提出了MIL-STD-188-110C(以下简称110C协议)短波标准规范,信号最大带宽为24k Hz。结合当前IC技术,本文以Xilinx XCZU9EG So C芯片为平台,针对传
与GNSS卫星相比,低轨卫星对地运动速度更快,可提供更强的落地信号,若将其用于导航,可以有效提升中高轨导航星座的性能,已成为下一代导航星座的发展方向。但是,现有的全球导航星座和低轨星座大多为单一构型,存在导航性能全球分布不均匀的固有问题。为此,已有学者提出混合构型星座的解决思路,但相关设计方法尚不成熟,分析与优化的效率也有待提高。本文针对区域/全球导航服务的LEO混合构型星座,开展星座设计与优化方
当前,工业物联网伴随着全球新一轮科技革命和产业变革应运而生,涉及工业与互联网等信息通信技术的各个环节和主体。为了满足工业物联网对高速率、高密度、低延时通信的需求,可见光通信提供了一种新型的解决方案。然而,工业物联网场景中设备的移动以及高密度小区产生的小区间干扰,对可见光通信的高速鲁棒传输提出巨大挑战。为此,本文面向可见光移动通信对鲁棒接收的需求,研究阵列可见光通信移动接收的几个关键技术,主要的研究
近年来,随着互联网、物联网和智能移动终端技术的飞速发展,泛在网络的广度与深度也随之增加,与之而来的就是泛在信息的爆发式增长。作为泛在信息的一种重要表现形式,泛在统计图表能将繁冗的统计数据以直观形象的形式展现出来,在地理信息表达和传输等领域应用广泛,其中包含了大量具有重要价值的信息,实现泛在统计图表中信息的智能解译可以为各种地图产品的具体应用提供数据支撑。泛在统计图表的数据格式为栅格型图像,因此可以
随着互联网和智能设备时代的到来,现有的频谱资源日益紧张,严重限制着终端用户的数字化体验,人们对高密度与高速率通信系统的需求日益强烈。通信频谱向更高频段延伸已然成为移动通信发展的必然趋势。众所周知,毫米波频段具有相当可观的频谱资源,能够很好的摆脱当前通信系统所面临的困境。然而毫米波通信同样存在诸多问题,如传输损耗高、绕射和衍射能力弱等,严重影响通信质量及信号覆盖范围。采用波束赋形技术的多波束天线系统
辐射源个体识别技术(Specific Emitter Identification,SEI)通过提取信号中蕴含的可以表现辐射源硬件特性的细微畸变来实现对某一特定发射设备的识别。其识别过程不需要对内涵信息进行解译和理解,在无线安全、自组织网、军事目标识别等领域得到了应用。在实际应用中,存在进行跨接收机SEI的需求,即利用多个接收机的接收数据实现对发射设备的识别,例如对广域运动辐射源的识别和多平台协同
波达方向(Direction-of-Arrial,DOA)估计技术是5G与物联网相融合的关键技术之一,超分辨子空间类DOA估计算法实现了较优估计性能,但由于均匀阵列存在孔径较小、阵元间互耦误差较大、阵列分辨力较低等不足,其性能仍有待提高。互质阵列作为一种新型的稀疏阵列,具有等阵元数时阵列孔径大、等孔径时阵元开销数少、阵元互耦误差小、高分辨力等优势,能够获得更优异的阵列信号处理增益,因此结合互质阵列
近些年,语音识别技术随着深度学习的发展再度兴起并进入新的发展阶段。在近场声学环境下,自动语音识别取得了超人的识别准确率。然而,在实际应用中,拾取语音通常包含噪声、混响、回声、人声等干扰因素,使得识别性能严重下降。与近场声学环境相对应,远场声学环境是指声源与接收器之间距离为1m到10m的声学环境,囊括了智能音响、可穿戴设备和助听器等大部分语音识别系统的实际应用场景。远场语音识别技术可以提升在复杂声学
Stencil是一类在科学计算和工程应用中常见的计算模式,其计算和访存开销随规模增大呈线性增长,适合在高性能计算机上并行执行。我国自主研发设计的“神威·太湖之光”由国产SW26010众核处理器搭载而成,是世界上首台性能超过100 Pflop/s的超级计算机。为充分发挥国产超级计算机在科学应用性能加速中的作用,针对Stencil计算的性能优化研究十分重要。然而,Stencil计算在国产异构众核处理器