基于Compute Shader的移动端GPU并行粒子群优化算法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:ak328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粒子群优化(Particle Swarm Optimization,PSO)算法是群集智能算法的一种。该算法全局搜索和收敛能力很强,而且概念十分简单也易于实现,所以发展十分迅猛并在各个领域都有应用。但实际中的问题往往都是离散化、多元化的,这就导致该算法的求解速度相对较低。幸运的是在粒子群优化算法中粒子之间互不干涉,所以并行化加速方案可以很好的解决这一问题。GPU技术的快速发展,带来了基于GPU的通用计算技术(General-Purpose computing on the GPUs,GPGPU)在高性能计算领域研究与应用的热潮。目前主流的GPGPU工具有NVIDIA公司的CUDA、苹果公司提出的OpenCL等。Compute Shader(计算着色器)是微软在DirectX 11 API中新加入的特性,使用Compute Shader也可以在GPU上做并行通用计算。Unity中的Compute Shader虽然是在DirectX 11 DirectCompute的技术上建立起来的,但由于OpenGL ES 3.1版本中引入了 Compute Shader,这使得在移动端使用Compute Shader做GPGPU成为可能。针对解决复杂的问题时PSO算法求解速度相对较低的情况,进行了在移动端GPU上基于Compute Shader实现并行粒子群优化算法的研究。主要研究成果包括:(1)对比分析三种已有的基于CUDA的并行PSO算法,分析其优缺点。(2)通过对传统PSO算法的分析,结合目前被广泛使用的基于GPU的并行计算技术,设计实现了一种基于Compute Shader的移动端GPU并行粒子群优化算法,该方法能通过使用移动端GPU中大量的线程来并行处理每个粒子每个维度的搜索工作,从而加快整个粒子群的收敛速度。分析对多个基准函数的测试实验结果可得,与CPU端的串行PSO算法相比较,本方法取得了最高250多倍的加速比。
其他文献
直膨式太阳能-空气复合热源热泵热水器(DX-SASHPWH)一直备受关注,本系统中采用的新型集热/蒸发器通过将太阳能吸热板与螺旋翅片管结合,使得集热/蒸发器可以同时吸收太阳辐射
近年来,由于移动设备的大范围普及,我们可以方便得利用装有各种传感器的移动设备去采集周围环境中的传感数据,比如湿度,温度,交通状况等。移动群智感知的概念由此而来,它指的
生物质快速热解制油是生物质能利用领域的研究热点。但生物质自身存在缺氢多氧的特点,生物油也存在有利组分含量不足、酸性较高等问题。本文将从生物质三组分、玉米秸秆与多
随着我国经济的迅速发展,对石油的需求越来越大,石油的进口量也日趋增多。我国进出口的石油约有百分之九十从海上运输,在我国沿海海域航行的油轮每天多达四百余艘。其中VLCC
随着声呐探测技术的发展,为提高生存能力,“大潜深”已成为水下航行体的重要发展趋势,这对水声吸声材料提出了耐压和吸声的更高的要求。本文开展耐压型吸声聚氨酯弹性体的制
蚁群优化算法(Ant Colony Optimization Algorithm,ACO)源于对蚁群觅食过程的研究,通过每只蚂蚁的简单搜索,整个蚁群能够发现食物源与蚁巢之间距离最短的路线,是以群体智能为
为了改善传统直接转矩控制(DTC)调速系统中存在的转矩及磁链脉动过大等问题,将自抗扰控制、滑模控制等先进控制理论应用到异步电动机DTC中,设计了新的控制策略,达到有效削弱
石墨烯因为其各种优异性能引起科研界的研究热潮,石墨烯基宏观材料在储能、传感、催化等领域有很大应用前景。目前常用氧化石墨烯片作为组装石墨烯宏观材料的基础材料,先将氧
随着电力系统电网规模日益变大,系统运行的不安全性也不断增加,近年来全球发生的多起电压崩溃事故给人民生活和经济发展带来了重大影响,电压稳定性问题备受各国关注和重视,因此寻找评价系统电压稳定性的合适指标极其重要。基于线性化网络的电压稳定性指标,通过把电源等效为电压源、负荷等效为电流源,简化内部电力系统。该指标的计算不基于潮流方程,满足计算电压稳定的快速性,但当处于极限时,各节点电压不趋于理论值,不能准
流动聚焦作为一种毛细流动现象,能够稳定、连续、可控、低成本地产生微纳米级液滴或者颗粒。该方法通过流场的剪切作用,将液体界面平稳拉伸,进而形成极细的射流,射流由于不稳