基于多核CPU计算平台的并行离散事件仿真优化技术研究

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:jinwei001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强大的计算能力、低功耗特性以及可持续增长的潜力,使得多核CPU计算平台已成为高性能计算发展的主流方向之一。然而,现有的并行离散事件仿真技术应用于多核计算平台时仍存在同步时延开销大、时间管理算法适用性不足、内存管理和数据过滤效率低等问题,难以充分发掘多核处理器的计算资源,致使仿真应用性能仍有提升空间。因此,开展基于多核计算平台的并行离散事件仿真优化技术研究,对于充分利用多核平台计算资源,提高仿真运行效率、满足复杂系统仿真时效性要求等具有十分重要的理论意义和实用价值。论文针对当前基于多核计算平台的并行离散事件仿真技术存在的主要问题,在深入分析并行仿真相关研究和多核并行化技术发展现状的基础上,对基于多核计算平台的多样本融合处理技术、时间管理算法、多线程内存管理技术以及数据分发管理兴趣匹配算法等进行深度研究,主要工作和创新点如下:(1)提出了一种基于线程同步的多样本优先级融合处理并行仿真内核。并行离散事件仿真中的时间同步机制需要频繁调用同步操作确保事件按照正确的顺序处理,这会产生大量的同步时延开销,而现有的并行仿真内核和多样本处理技术都不能利用CPU计算核心同步等待空档来进行更多的仿真计算,造成计算资源浪费。对此,论文提出了一种基于线程同步的多样本优先级融合处理并行仿真内核MSF,该内核可为多个样本提供独立的事件队列,当一个样本的某个线程处于同步等待状态时,该线程将按优先级顺序调度下一个样本的仿真事件进行处理,利用前一个样本中的同步空档来处理后一个样本中的事件。实验结果表明,MSF能充分利用线程同步空档加速多样本处理,同时处理两个样本时,相比于并行仿真内核ROSS-MT,MSF最高能取得1.96X的加速比。(2)提出了一种基于事件回滚率的自适应时间同步调度算法。不同类型的时间同步算法适用于不同的并行仿真应用场景和参数配置,能否选择一个合适的时间同步算法直接决定了仿真应用性能的优劣,而现有的仿真引擎均不支持时间管理算法自适应调度,用户往往难以为仿真应用选出一个更合适的时间同步算法。对此,论文提出了一种基于事件回滚率的自适应时间同步调度算法ATSS,通过为几个经典的时间同步算法建立时间开销数学模型,确定事件回滚率等影响算法性能的关键参数,获取判定算法性能优劣的关系式;同时,论文还提出了一个时间窗口大小自适应的有限乐观时间同步算法LOTS,根据事件回滚率自适应控制时间窗口大小以获取更优的乐观同步性能。实验结果表明,ATSS算法能从经典的保守同步、乐观同步及LOTS算法中选出一个表现更优的算法。(3)提出了一种基于内存使用模式的多线程内存管理算法。现有的内存分配器,无论是通用或多线程专用,在为并行仿真应用提供内存管理服务时或存在锁竞争或需要借助原子指令以避免锁竞争,存在较大的时间开销。对此,论文提出一种基于内存使用模式的多线程内存管理算法HMalloc,针对线程局部和共享内存不同的使用模式,从操作系统分别申请局部和共享两类内存块,局部内存采用增量分配和联合释放机制进行管理;共享内存采用基于标志位的方法进行管理,并利用缓存机制加速共享内存申请和释放过程。HMalloc无需原子指令即可避免线程锁竞争,实验结果表明,相比于现有的多线程内存分配器,HMalloc在内存申请释放速度、避免伪共享和线程锁竞争等方面优势明显,能获得10%以上的性能提升。(4)提出了一种基于快速查找增强的兴趣匹配算法。sort-based匹配算法是现有数据分发管理兴趣匹配算法中整体性能最优的,然而,无论是静态或动态sort-based匹配算法都存在较大的排序和比较开销。对此,论文提出了一个二分查找增强的sort-based静态匹配算法BSSIM和一个指数查找增强的sort-based动态匹配算法EDSIM。BSSIM采用二分查找法快速获取区域匹配关系,减少匹配过程中的排序和比较开销。EDSIM将变化区域和静态区域存放到不同的列表中,降低变化区域匹配关系更新过程中的排序和比较开销,并采用指数查找法加快匹配关系更新。实验结果表明,相比于现有的静态和动态sort-based匹配算法,BSSIM最高可获得2.3X的加速比,EDSIM最高可获得2.68X的加速比。在上述研究成果的基础上,论文设计实现了一个基于多核CPU计算平台的并行仿真支撑环境MTPSE,并通过高速公路交通仿真和民意趋势仿真应用实例对论文提出的优化技术进行综合测试,实验结果表明,相比于多线程并行仿真引擎ROSS-MT,在16核的CPU上,MTPSE最高可获得2.46X的加速比。
其他文献
精确的时空信息对航天器轨位保持以及业务开展具有重要作用,是航天器遂行任务的重要基础。虽然测定轨方法众多,但各有优缺点,并不能完全解决航天器高精度轨道确定的问题。传统的地面定轨再将轨道上注给卫星的模式存在通信压力大、信息滞后的问题,不能满足航天应用日益增加的实时性需求。随着北斗三号系统全面建成,基于北斗星间链路的测定轨成为用户航天器进行自主定轨的一种可行方案。北斗星间链路采用并发空分时分双工星间链路
学位
伴随着应用复杂性以及其所需处理数据量的不断增加,从工业界到学术界,越来越多的用户开始选择将应用部署在数据中心中来满足相关的资源需求。而作为数据中心的重要组成部分,互联网络很大程度上决定了数据中心工作效率的高低与用户程序性能的优劣。与此同时,网络领域也迎来了两种重要的新技术,软件定义网络(Software-Defined Networking,SDN)以及可编程硬件。SDN网络大大减轻了管理员日常网
学位
随着近年来机器人技术的高速发展,地面无人平台在灾难救援、警戒巡逻以及后勤运输等领域的应用更加广泛。相对于有人车辆,地面无人平台可以在更加复杂的环境下行驶。轮式地面无人平台具有行驶效率高、速度快、转向灵活等优点,成为近年来各国地面无人平台的发展重点。但轮式地面无人平台在越野环境下,存在越障能力不足、软路面牵引性能差等机动性问题。围绕提升轮式无人平台的机动性,各研究机构试图通过构型创新来解决这些问题,
学位
电子信息设备不可避免地产生无意电磁辐射,这些电磁波中含有各种信息,存在着信息泄漏的潜在风险。随着信息化发展,电子信息设备的电磁信息泄漏安全问题也日益突出。开展信息设备的电磁信息泄漏检测研究,不仅可以有效发现设备的信息泄漏问题,还可以指导设备的信息泄漏防护,对于保障信息安全具有重要意义。本文重点开展了深度学习方法在电磁信息安全领域的应用研究。针对低信噪比下的电磁信息泄漏特征提取、电磁信号的多重信息泄
学位
吸气式高超声速飞行器极具战略意义和经济价值,其关键技术之一在于机体/进气道一体化设计。通过建立内外流一体化轴对称基准流场,全乘波设计方法[1]能够完成乘波构型的机体/进气道一体化设计,且能让该构型的前体和机体类机翼部件、唇口外机腹部件等仍然保持前缘乘波特性,是一种有很好工程应用前景的乘波设计方法。但该全乘波设计方法只用到了轴导乘波设计,只能设计获得圆弧形唇口进气道,不具备三维水滴形进气道的设计能力
学位
基于阵列传感器的辐射源被动定位在雷达、声纳、通信、电子对抗等领域中均具有重要的应用。相对于窄带辐射源信号,宽带辐射源信号更有利于目标检测、参量估计和目标特征提取,在实际中获得了更广泛的应用。然而,与日趋成熟的窄带辐射源定位技术相比,围绕宽带辐射源的定位研究起步较晚,还需要进一步地发展与完善。当前针对宽带辐射源的定位算法主要基于信号的子空间类方法,且算法大多瞄准远场辐射源的定位,忽视了一些特定应用场
学位
低功耗-无人海洋装备长航程、长续航工作的能源供给是国家深远海战略的重要基础。利用波浪能发电装置吸收、捕获、转换海洋波浪能是为其提供持续、稳定、可靠能源的国家战略需要。众多波浪能发电装置中,基于垂荡运动的波浪能发电装置较适合低功耗-无人海洋装备的供能需求。垂荡式波浪能发电装置研发过程中水面浮体水动力学与能效特性研究是核心和关键工作。本文采用理论分析、数值计算和实验验证的方法,先后对垂荡式波浪能发电装
学位
随着人类文明的发展和科技的进步,人们了解这个世界的手段越来越多,获取的数据也更加复杂多样,信息的获取、处理等也从单一的形式逐渐变成图片、文本、视频等多模态的数据。传统机器学习一般针对某一类型数据进行建模学习,而当前面对种类繁多的多模态数据,多模态机器学习也应运而生。无论是传统机器学习还是多模态机器学习都离不开对数据的处理,如何有效获得数据中的信息始终是一个重要的研究领域。传统机器学习中的数据表征学
学位
地球的重力场测量是地球物理学、地球动力学、大地测量学、海洋科学以及空间科学的重要组成部分。海洋覆盖了地球71%的表面积,因此海洋重力场的测量至关重要。与船载重力测量相比,靠近海底的水下动态重力测量可以更接近重力场源,获得用于小型矿床探测和海水入侵监测的短波长的重力信息。由于水下没有卫星信号,水下动态重力测量面临着许多难点和挑战,研究并攻克捷联式水下动态重力测量的科学问题将为资源探测和海洋全息重力场
学位
海洋水下温盐要素场是影响海洋过程和气候变化的重要环境因素,获取海洋温盐结构需要大量可靠的温盐数据作为支撑。然而可采集海洋内部状态的现场观测数据,特别是盐度资料,仍较为匮乏,表现为数据分布零散且时空分辨率不高,难以满足海洋科学研究需要。卫星遥感技术的发展为海洋科学研究提供了较高时空分辨率的资料,尤其是近年来发射的三颗盐度卫星,有效拓展了过去极为有限的海洋盐度观测信息。然而卫星资料仅能观测海洋表层,无
学位