基于多GPGPU并行计算的虚拟化技术研究

来源 :南京航空航天大学 | 被引量 : 4次 | 上传用户:zjm2190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跟CPU相比,GPU在计算能力、能耗上具有显著的优势,被广泛应用于高性能计算领域。虚拟化是云计算的主要支撑技术之一,屏蔽硬件基础设施使多台虚拟机透明地共享集群中的GPU设备,从而降低配置成本,提高资源利用率。目前,GPU通用计算的虚拟化技术尚处于研究阶段,虚拟化环境下资源共享方案普遍缺乏对GPU的有效支持。本文以通用计算框架CUDA为研究对象,设计一种基于多GPGPU并行计算的虚拟化的方案,实现一种可动态调度、支持多任务并发的GPU虚拟化解决方案。具体工作包括以下几个方面:第一,采用动态库拦截的方法将GPU引入虚拟机,设计了基于多GPU计算资源特征的动态分配与管理的架构,该架构分为虚拟化用户层、虚拟化资源管理层和虚拟化资源服务层,解决了GPU通用计算在虚拟化环境下的适应问题,实现GPU资源在多个计算节点间的共享。第二,针对大规模计算任务场景,提出了在虚拟化环境下多GPU并行计算的实现方案,使用多线程或流处理的方式实现多GPU并行计算,分析了GPU多层次存储结构、传输、通信等方面内容,通过实验分别对数据松耦合交互模式(如蒙特卡罗方法)和紧耦合交互模式(如QFT算法)实现多GPU并行计算。第三,提出了一种基于动态负载量多负载状态的GPU负载均衡算法DMLS-GPU(Dynamic and Multi-Load Status algorithm for GPU),通过将负载与GPU设备的硬件能力和任务本身的特性相结合,解决了虚拟化方案中动态评估GPU设备计算能力的问题。实验分析表明,在虚拟化环境下可实现多个CUDA程序并发地使用一块或者多块GPU设备,并验证了本文的虚拟化方案具有良好的可扩展性和高效性。本文工作针对GPU通用计算虚拟化过程中面临的挑战和制约,研究虚拟化环境下的多任务GPU资源共享和多GPU并行计算,以进一步拓展其应用空间。
其他文献
为了实现通用多媒体访问,允许持有各种不同分辨率的视频播放终端的用户在异构的网络环境下无缝访问各种视频资源,并且充分利用网络带宽,就需要进行视频空间分辨率转码,将高分
无线传感器网络是现代互联网进一步深入发展的产物,被认为是21世纪最重要的技术之一。它将逻辑上的信息世界与物理世界融合在一起,协作地实时监测、感知和采集网络分布区域内的
僵尸网络是由僵尸网络控制者通过命令与控制(Command and Control,C & C)服务器控制的众多僵尸主机组成的一个网络,它通过C&C信道进行通信。僵尸网络可以用来执行分布式拒绝
目前数字电视发展掀起了世界范围的热潮,世界各地的电视节目组织都在积极的开展自己的数字电视广播。用户对电视节目质量要求的提高以及数字信号技术的发展,促使数字电视取代
量子计算与量子信息是近二十多年来发展起来的一门新兴学科,具有广阔的发展前景。量子计算模型是量子计算的一个重要研究分支,目前已有多种量子计算模型被提出并得到广泛而深入
随着现代化社会日益趋于网络信息化,网络信息系统在日常生活中扮演着举足轻重的作用。虽然传统的安全措施提高了网络信息系统的安全性,但各种入侵事件还是会不断的发生,为此
面向方面编程AOP是一种全新的软件开发技术,它解决了在面向对象编程中有横切关注点所引起的代码分散和代码纠缠问题。由于AOP引入了新的语言机制:连接点、切入点和通知等,这影响
信息技术的发展使得人们获取信息的能力逐步提升,信息量急剧增大,形式也逐渐多样化,对数据库的存储能力和处理技术的要求也不断提高。Skyline查询作为一种能够在多属性数据中
信息技术尤其是网络技术的飞速发展和广泛应用,给财务费用的控制和管理带来了新的挑战和要求,笔者设计的项目是一个为东北电子技术研究所设计和开发的供自身内部使用的财务管理
当今世界,数据的安全性与可靠性越来越显得重要,不管是在银行,还是其他商业公司,数据的丢失往往会带来不可想象的可怕后果。磁盘阵列系统虽然在数据安全性与可靠性方面比一般