【摘 要】
:
演化进化算法作为经典的启发式搜索算法,有着优异的性能表现,是解决各类实际问题的重要工具。随着演化进化算法在科学与工业领域的研究与应用越来越广泛,对于其求解效率的要求也在不断地提高。演化进化算法在求解大规模优化问题时的性能表现难以满足高效率的需求。通过在高性能集群上进行并行化研究来解决这个问题具有重要的现实意义。神威·太湖之光拥有超过125PFlops的峰值运算性能,可以为提升演化进化算法求解大规模
论文部分内容阅读
演化进化算法作为经典的启发式搜索算法,有着优异的性能表现,是解决各类实际问题的重要工具。随着演化进化算法在科学与工业领域的研究与应用越来越广泛,对于其求解效率的要求也在不断地提高。演化进化算法在求解大规模优化问题时的性能表现难以满足高效率的需求。通过在高性能集群上进行并行化研究来解决这个问题具有重要的现实意义。神威·太湖之光拥有超过125PFlops的峰值运算性能,可以为提升演化进化算法求解大规模问题时的效率提供理想的平台。其采用的申威众核处理器在物理架构上进行了很大的创新,不仅有着强大的计算能力而且在能耗比方面也表现出色,但是架构的变动使得内存模型与编程模型发生了巨大的改变,传统的并行算法无法发挥出申威众核架构的性能优势。这就需要根据架构特点,从进程级与线程级两方面重新设计算法的并行方式。本文针对大规模优化问题,以邻域搜索的自适应差分进化算法(Self-adaptive Differential Evolution with Neighborhood Search,Sa NSDE)为优化算法,对大规模优化问题的求解过程展开了一系列并行化研究,主要工作如下:(1)针对大规模优化问题的维度并行展开研究,设计并实现了基于申威众核架构的并行合作协同Sa NSDE算法(Sunway Cooperative Co-evolution Sa NSDE,sw CCSa NSDE)。进程级以合作协同进化模型为并行模型,将高维问题分解为低维子问题,实现各子问题之间求解过程的并行化。为了缓解单个进程上的计算压力,使用从核阵列对个体适应度计算部分进行了加速。同时针对申威众核处理器内存带宽不足的限制,设计了合理的访存数据粒度,利用DMA方式进行批量访存。实验证明,与串行算法、采用岛屿模型的算法相比,sw CCSa NSDE有着更好的收敛结果。二级并行算法与串行算法相比获得了239.01的最大加速比。(2)针对大规模优化问题的种群并行展开研究,设计并实现了基于申威众核架构的并行池Sa NSDE算法(Sunway Pool Sa NSDE,swPSaNSDE)。进程级以种群分布原则的池模型为并行模型,实现各子种群之间求解过程的并行化。使用从核阵列实现了蜂窝模型,将个体分布在每个从核上,通过寄存器通信实现从核间个体信息的数据共享,有效降低了从核的访存依赖。实验证明,swPSaNSDE算法表现出了良好的可扩展性。(3)针对大规模优化问题的维度和种群两层并行展开研究,设计并实现了基于申威众核架构的并行混合Sa NSDE算法(Sunway Hierarchical Sa NSDE,swHSaNSDE)。对于大规模问题,首先使用合作协同进化模型从维度方面进行分组实现各子问题优化过程的并行。随后,采用池模型从种群方面进行划分实现了各子种群优化过程的并行。最后对从核性能进行了优化:为了解决离散访存的问题,将离散存储的数据调整为连续存储,不仅有利于DMA批量访存,而且可以提高数据的命中率;采用双缓冲方法,将从核访存过程与计算过程相重叠,有效隐匿了从核访存的时间。实验证明,swHSaNSDE算法整体性能有了进一步的提高,取得了良好的加速效果,与串行算法相比获得了290.93的最大加速比。
其他文献
图像融合是将在同一场景下,通过不同传感器获得的图像综合成一幅新的图像,使得融合图像具有更丰富的细节信息,对场景内的所有物体都能够清晰的识别,从而便于后续进一步的图像处理和分析。随着对图像融合领域的深入研究,图像处理的手段越来越丰富。以曲波变换、轮廓波变换、剪切波变换、非下采样剪切波变换(Non-Subsampled Shearlet Transform,NSST)等为例的多尺度变换工具能够对图像进
运动目标检测与跟踪技术作为计算机视觉领域重要研究方向之一,其被广泛应用于智能监控、交通系统和人机交互等多个领域。而在实际的应用场景中,往往存在动态背景、光照变化、遮挡、尺度变化和快速运动等复杂干扰的影响,给运动目标的检测与跟踪产生巨大的困难和挑战。本文针对鬼影及阴影的消除方法、特征融合方法和模型更新策略进行研究,具体研究工作如下:(1)针对视觉背景提取(Visual Background Extr
自旋转移力矩随机磁存储器(STT-MRAM)是一种新型的非易失性存储器,被认为是最具有潜力替代Flash的新型存储器之一,在未来的各行各业均具有广泛的应用前景。本论文针对STT-MRAM外围电路的两个主要组成部分:读电路和写电路,进行了相关的设计与研究。首先,针对深纳米级的STT-MRAM,设计了一种具有动态参考和可变容差的新型读电路,实现了极高的传感裕度(SM)和较小的读取干扰(RD);然后,设
视觉目标跟踪经常被应用于无人机、视频安防、智慧城市等领域,其任务是给定初始帧中待跟踪目标物体的信息,在后续视频帧中预测目标的实际位置和尺寸大小。在复杂背景环境下既保证跟踪精度又保证跟踪速度是视觉目标跟踪任务的难点。本文以深度孪生网络结构为基础,针对当前视觉目标跟踪算法中存在的难点问题展开研究,具体研究成果如下所述:(1)通常卷积网络提取到的特征包含低层、中层和高层抽象信息。许多孪生网络类跟踪算法在
信息物理系统(Cyber Physical Systems,CPSs)是将传感、通信、计算和控制过程高效结合而形成的复杂系统。目前,信息物理系统已在智能电网、医疗监测、智慧工厂、智能交通等众多领域得到广泛应用。不同于以往封闭式的工业内部网络,通讯网络的接入极大地提高了系统运行效率同时,也带来了许多安全问题。近年来针对信息物理系统的攻击事件频频发生,造成巨大的经济和社会损失,这已经引起了国内外相关学
图像相较于文字而言,传递信息的方式更为简单直接,因此运用更为广泛,但图像在采集、传输和使用过程中,往往会引起不同程度的失真,这就需要质量评价算法对其进行评估。现阶段图像质量评价的主流算法大多基于机器学习(特别是深度学习),现有研究表明机器学习算法对数据的对抗性扰动极其不稳定,存在鲁棒性和安全性问题。基于此本文研究了一系列的对抗性扰动样本来攻击现有图像质量评价算法,找出其漏洞,希望本文的攻击方式能让
随着物联网应用与规模的持续增长,同时带来了空前的网络安全威胁和安全风险。对此学术界提出利用威胁情报来对日趋复杂的安全问题进行预警和预测,威胁情报作为一种网络安全大数据,可以有效帮助防御者更好地提升网络安全防护能力[1]。在此,如何高效构建威胁情报就成了一个核心问题。然而,当前在信息安全领域,威胁情报普遍存在着冗余度较高、内容单一、标准不统一的缺陷,难以共享。对此本文通过对恶意代码和非结构化网络威胁
随着网络通信技术和集成电路制造工艺水平的不断提高,系统间的信息交换变大。传统的并行传输接口技术传输数据时,具有抗干扰能力弱、时钟偏斜大和传输距离短等缺点,导致传输接口成为限制数据传输速率的瓶颈。为了满足日益增长带宽的需求,高速串行接口SerDes逐渐取代传统的并行接口,成为了高速接口的主流技术。SerDes通常采用差分的传输方式,差分传输方式具有抗干扰能力强和传输距离远的优点。SerDes作为主流
目标跟踪一直是计算机视觉研究领域的一个重要分支,其通过对视频帧中感兴趣的部分进行数字化处理与定位,从而实现有效跟踪。近几十年来,由于研究人员的不断努力,涌现出许多优异的跟踪算法。与此同时,该项技术也在多个生活场景中得到广泛的应用,比如收集交通数据进行交通指挥监视、自动驾驶中用于估算障碍物运动轨迹的视觉导航、医学诊断中超声波图像的自动跟踪分析等等。随着研究与应用的深入,现实场景中诸如光照、遮挡、平面