基于GPU高性能计算的切割与布局问题的并行求解方法研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:wangchun2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
布局问题是一个经典的组合优化问题,其实用性和计算上的NP-难度带来的巨大挑战吸引了来自工程、数学、计算机科学等领域的无数学者对其进行广泛的研究。目前通行的布局求解算法大多还在采用串行计算方法,对并行计算尤其是低成本并行机算开发不足,较为严重地影响了算法的运行效率和求解质量。因此,为了从根本上提高布局问题的求解效率,本文采用基于GPU结构的CUDA技术设计并行算法。   CUDA的性能好,兼容性强,在生产力上整合了CPU和GPU,可以在从大型的计算设备到个人消费级产品的任何层次的系统中运行,开发成本比较低。由此,本文针对两类典型的布局问题——二维无约束布局问题和二维条带布局问题展开CUDA并行算法研究,取得了满意的结果。   本文主要工作包括:   一、综述了布局问题的研究现状,分析了目前的并行研究成果,并对基于CUDA的并行技术进行了总结,归纳了基于CUDA的布局求解并行原则。   二、针对二维无约束问题进行了精确算法的CUDA并行设计,获得最大近10倍增速。分析了动念规划精确算法求解步骤,根据其特点设计了CUDA并行策略,采用CUDA编程实现了算法的并行改进。经过对串并行数值试验的数据对比,发现改进后的运算速度最大提高近10倍,小规模算例增速在5~6倍之间。   三、针对二维条带布局问题的元启发算法进行了CUDA并行设计,获得大于7倍的增速。对原串行算法设计了新的扰动准则,总结了以往的并行策略,并根据算法特点设计了CUDA并行策略,采用CUDA编程实现算法的并行改进。经过对串并行数值试验的数据对比,发现对于相同算例,改进后的算法速度提高了7.3倍,验证了改进算法的可行性。   基于以上研究工作,本文采用的CUDA并行技术应用在切割与布局问题求解中,可以切实提高算法的求解效率,增加工程效益。在CUDA并行技术的实现过程中需要注意线程模块的划分、数据传输及内存分配的问题。本文的后续工作可以展开在其他复合算法中应用CUDA并行或者将一些改进思想引入到算法的CUDA并行改进中。
其他文献
重复采动的地表移动是许多矿区开采沉陷研究中都遇到的问题,根据目前在重复采动的地表移动研究的进展情况和煤矿生产的要求,本论文采用相似材料模拟试验、灰色系统理论分析和有
岩体是一种具有不连续性、非均质性、各向异性和非线性的天然地质体,内部富含微裂纹、孔隙、节理、断层等不连续面,这些不连续面对岩体的应力空间分布和破坏模式有着重要的影
In this article we are interested in the numerical computation of spectra ofnon-self adjoint quadratic operators. This leads to solve nonlinear eigenvalue prob-
采矿方法是矿山生产和建设的核心内容,寻求安全、高效、低贫损、低成本的采矿方法,是矿山生产的迫切需求,也是提高经济效益、合理规划、可持续发展的基础。 本文针对老厂
近年来,随着机器人、信号的采集与处理、计算机智能控制等技术的飞速发展,重载自主行走足式机器人已经成为新的研究热点。机器人的负载能力、抗冲击能力、动作执行速度大小及
为了满足工作面超长规快速生产,采用双巷布置系统,两巷之间留有煤柱,回采巷道的稳定性是用煤柱和锚杆支护体系两者配合来予以保证的,因此在现有设备和锚杆支护现状条件下,选
紫金山金铜矿选铜尾矿因存在黄铁矿精矿中金品位偏低的问题,致使黄金资源无法得到有效的利用,造成黄金资源的浪费,因此,探索合理的浮选技术有效回收金,同时满足技术经济的要
随着当前矿山开采规模的不断增大,矿井开采深度不断延深,以及开采设备机械化水平的不断提高,矿井通风量严重不足,矿井高温越来越突现,特别是无轨设备放热成为矿井安全生产的
学位
并联机构由于其本身具有的诸多优点,如刚度高、承载能力强、动态性能好、速度快和结构简单等,受到了国际学术界和工程界的广泛重视。并联机构的出现弥补了传统的串联机构固有的许多缺点,然而,并联机构本身同时又存在着工作空间相对较小、接触刚度小、运动耦合、数学模型相对复杂、控制困难等问题,使得并联机构的应用受到很大的制约。为有效解决这些问题,使并联机构真正走向实用化,在机构的构型设计上采用串并联复合结构和混联