支持GPU全虚拟化的动态迁移研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hghlyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理器单元(GPU)是现代计算机图形计算和处理的核心。由于GPU具有并行处理和计算的特质,它在图形处理以外的计算处理能力也具有广泛的应用前景和潜力。然而,GPU有其局限性,由于各种技术原因导致GPU在应用中会出现非正常停机或挂机(hang);同时,GPU全虚拟化尚不能支持动态迁移。这严重影响了GPU应用的效率。为了解决GPU应用程序遇到的非正常停机或挂机的现象,目前业界最流行的方法是通过GPU供应商提供的硬件机制对GPU进行重新启动,即Reset。重新启动操作的缺点是明显的:为了维持操作系统的稳定,其代价是影响了GPU应用程序的持续性和连贯性。针对上述问题,本文设计了一种行之有效的解决方案。具体来说,在Intel gVirt方案的基础上,开发了一个新的动态迁移方案,实现对虚拟化GPU资源的高可用支持。我们把这种方案定义为High Availability gVirt,简称gHA。这种方案的创新点是针对GPU全虚拟化环境,设计了双机同构模型,系统运行过程中对整个虚拟机(VM)进行迭代式备份,并将VM动态迁移到一个新的备份主机。得益于双机同构设计,当GPU出现非正常挂机,备份虚拟机立刻接管应用程序的运行,从而实现了虚拟化资源和环境的高可用性(High Availability),有效抑制和减轻了GPU的局限性。与其它任何应用程序一样,gHA的应用不可避免地产生成本和开销。为此我们做了大量的测试与实验。实验结果表明,gHA导致的虚拟机备份的停机时间在272-551毫秒之间,比无GPU虚拟化支持的空闲虚拟机仅多出了48-327毫秒;对于2-4秒的备份时间间隔,此停机时间是令人满意的结果。我们还对不同的GPU工作负载进行了测试,测试结果显示,对于六种不同的GPU工作负载,gHA运行性能可达到gVirt的65.0-92.6%,这在保持高性能和稳定性之间是一个很好的平衡。在网络开销方面,gHA方案在运行期间占用了80-180Mbps带宽,对于两个主机之间1Gbps的总带宽,上述带宽占用也是非常小的。
其他文献
邻苯二甲酸二(2-乙基已基)酯(Di-(2-ethylhexyl)phthalate,DEHP)作为邻苯二甲酸酯类(Phthalate esters,PAEs)代表性化合物之一,广泛应用于一次性塑料消费品、食品包装、聚氯
本文在具有Holling型功能性反应的捕食者—食饵系统的基础上引入生境复杂性效应、时滞效应和收获效应,建立了具有生境复杂性效应和收获效应的多时滞的捕食者—食饵系统.本文运用动力系统的相关知识对系统的动力学行为进行了研究,并通过数值模拟来验证理论分析的结果.首先,本文对一类具有生境复杂性效应和线性收获效应的多时滞的捕食者—食饵系统进行了研究,包括解的正有界性、平衡点的稳定性以及分支周期解的性质.研究
最近,[Hou and Deng,J.Phys.A:Math.Theor.,51,155001(2018)]推导了一种向后的带有反应扩散项的Feynman-Kac方程,本文对该方程的二维情形提出了一个有限差分离散格式.数值求解该方程的关键在于如何离散时间回火分数阶物质导数和回火的分数阶Laplacian两类非局部算子.这里,我们利用了卷积求积方法来离散时间回火分数阶物质导数,得到一阶和二阶的离散格
外来物种入侵威胁全球生态安全和农业安全,造成巨大经济损失。土壤生物在植物入侵过程中发挥着重要的作用。如植物能够改变土壤生物群落结构,从而调控后期植物生长,即植物-土
蚊传播多种疾病,包括疟疾、登革热、日本脑炎等,严重危害人类健康。防制蚊媒可有效阻断蚊媒病的传播,化学防制是当前蚊媒防制的主要手段之一。然而随着杀虫剂长期、大量的使
背景:慢性淋巴细胞白血病(Chronic lymphocytic leukemia,CLL)是西方国家最常见的白血病类型,该疾病目前仍不可治愈。B细胞受体(BCR)信号途径的活化和微环境的因素均在CLL的
随着互联网的普及和计算机技术的快速发展,越来越多的数据涌入我们的生活中。海量的数据造成了信息过载的问题,用户容易被没有价值的信息所干扰。推荐系统通过对用户历史行为
NADH(烟酰胺腺嘌呤二核苷酸)作为所有生物新陈代谢过程中重要的辅酶,其含量与包括癌症肿瘤、帕金森综合症在内的多种疾病有直接相关性,因此对细胞内NADH含量的检测能为相关疾
目的重金属汞是常见的环境污染物,对神经系统、消化系统、生殖系统以及免疫系统有毒性作用。目前,关于汞对机体局部毒性作用的报道较少。本文以小鼠为实验动物模型,以腹腔注
背景及目的生殖道沙眼衣原体(C.trachomatis,CT)感染是最常见的性传播疾病之一。CT是一种严格细胞内寄生的病原体,而细胞自噬是常见的细胞抵抗病原体感染的机制之一。既往研