基于OpenCL的多GPU并行计算的研究与应用

被引量 : 0次 | 上传用户:sdmligq1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构计算被视为计算机处理器的发展继单核、多核之后的第三个时代,它实现了多种体系架构的处理器间协同运算,有效缓解在提升CPU时钟频率和内核数量的过程中遇到的散热和能耗问题,同时增强了计算平台的可扩展性。异构计算系统通常包含除CPU以外的一个或多个协处理器,协处理器一般是包含众多处理核心的专用功能计算设备,只有通过合适的并行程序才能充分利用其并行计算能力。OpenCL是一个为异构设备编写程序的标准框架,虽然它的出现增加了程序在各平台之间的可移植性,但是在多个计算设备协同计算时,多种计算设备的调用、设备间的负载均衡等问题严重制约了它的普及。因此,对异构系统下多设备并行计算的研究具有重要的意义。本文依据OpenCL规范,利用多线程技术实现了多平台下多GPU的调用,分析了不同的任务划分模型对计算性能的影响,优化了存储器间的数据传输。随后,设计了可利用多个GPU辅助加速的两个算法来验证多GPU并行计算研究的可行性,第一个算法为适合较大规模数据的内部排序算法,算法中设计了适合设备端的GPU内部排序算法和主机端的基于败者树数据结构的归并排序算法,与CPU串行排序算法相比,该算法在多GPU的辅助下对较大规模数据的排序运算时,性能提升了十倍左右。另一个算法利用多GPU加速柔性作业车间调度问题的求解,该算法设计了适合GPU架构的数据结构以及基于岛屿模型的遗传算法,利用GPU提高了种群内个体的进化以及个体的评估效率。该算法在多GPU的加速下,与基于CPU的遗传算法求解柔性作业车间调度问题相比,在处理更大种群规模的前提下,在更短的时间内取得了较优的解。
其他文献
女大学生是具有一定程度文化和科学知识的女性群体。在现代社会,女大学生数量逐年增加,她们充分参与社会生活的方方面面,并发挥着不可替代的作用。然而,由于传统价值观念对女
随着经济全球化和知识经济的不断深入,无形资产在企业中的价值创造功能越来越明显,对企业的战略起着越来越重要的作用,所以越来越多的信息使用者开始关注无形资产的信息。但
随着社保制度的不断发展和完善,我国基本建立了覆盖绝大多数人口的社保体系。但是人口老龄化危机给现有社保体系的安全运行带来巨大压力,根本原因在于现有社保基金筹资模式存
乡村聚落空间及其发展一直是地理学研究的重要内容。从农村地理学的角度来看,学者们的研究视角多集中于有形形态演变,即较多地关注于乡村聚落空间结构的演变,而较少地关注其
随着我国高等教育体制改革的不断深入,民办独立学院的突起,调整学院内部治理结构,解决学院发展中的权力分配与制衡问题,成为学术界的一个研究热点。学院内部治理要素主要包括治理
太阳能作为一种新型清洁能源,是未来社会的主要能源之一。目前市场上仍以Si太阳电池为主,Cu(InGa)Se2(CIGS)薄膜太阳能电池具有转换效率高、廉价、稳定等特点。随着资源和环
由于全球环境遭到的破环越来越严重,进而引发了一系列的污染问题,特别是能量与资源的严重缺乏。为此人们迫切的需要解决能源匮乏问题,但因为电池技术尚未有所突破,所以,电动汽车的
作为冶金熔体中重要的元素,O和S含量的精确的控制一直吸引同时困扰着冶金工作者。在冶金凝固的过程中,O和S会发生偏析,形成具有严重危害的氧化物,硫化物夹杂等,对成品的弯曲
PDCA循环模式是管理学中提高质量管理所遵循的科学程序,运用PDCA循环模式进行《大学语文》课程教学具有多方面的优势,能促进空间课程教学质量的提升和学生自学能力的提高。
目的探讨提高鼻内镜手术疗效的方法。方法回顾性分析鼻内镜手术101例鼻息肉患者资料。结果101例随访6个月至1年,治愈78例(77.3%),好转17例(16.8%),无效6例(5.9%),有效率为94.1%,无严重术后并发症