多核机群节点间高效通信关键技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:emeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行应用对计算能力的需求永无止境,推动着高性能计算从百万亿次向千万亿次乃至亿亿次规模进发。随着系统规模的不断扩大,作为影响并行应用的性能和扩展性的重要因素之一,机群通信系统将面临诸多挑战。首先,系统规模扩大导致节点数目不断扩展,这要求节点互联网络具有良好的可扩展性;其次,多核处理器的发展使得单个节点内部存在更多的处理器单元,增大了对网络资源的竞争;再次,虚拟化技术不断普及和异构体系结构的出现,给传统的通信系统的性能和可扩展性带来了新的挑战。   针对多核机群环境对通信系统的影响和需求,本文主要面向性能和可扩展性问题,重点研究了基于目前主流的高性能互联网络的高效节点间通信关键技术。本文的主要贡献如下:   (1)针对超并行体系结构(HPP)的多操作系统核心特点,提出了基于节点内的全局物理地址空间的高效I/O虚拟化方法,为异构结构下多核心系统的节点间高效通信提供了支持。作为典型的异构多核结构,HPP结构采用了主从式的多操作系统核心来管理异构节点。本文提出的I/O虚拟化方法采用了半虚拟化的设计思想,基于全局地址空间支持,主、从核心在通信的关键路径上均可对网络设备直接发起I/O操作,从而获得最佳的I/O虚拟化性能。对曙光6000原型系统的测试表明,从核心使用虚拟化InfiniBand的通信性能与主核心相当,I/O虚拟化对应用性能的影响小于2%。   (2)提出了虚拟机感知的通信协议设计方法,以解决虚拟机环境下节点间通信面临的可扩展性问题。未虚拟化环境下针对通信系统的可扩展性问题提出的方法,在虚拟化环境下将不能有效发挥作用。本文提出的通信协议设计方法,实现了虚拟机感知的通信域共享及虚拟机感知的连接管理机制,从而利用未虚拟化环境下提出的相关方法有效解决了虚拟机环境下通信系统的可扩展性问题。在由16核刀片组成的虚拟化机群系统中,Alltoall的性能提高了15%~20%,通信系统的扩展性提高了16倍左右,从而验证了使用本方法的通信协议在性能和可扩展性上均与未虚拟化环境相当。   (3)提出了虚拟链路感知的集合通信优化方法,以缓解多核环境下节点间通信对网络资源的竞争。目前主流的高速网络提供了用于支持细粒度QoS的虚拟链路机制。基于本文提出的虚拟链路感知的集合通信优化方法,并发的通信进程可使用不同的虚拟链路进行通信,这提高了通信进程的并发度和同步性,从而可获得更好的集合通信性能。测试表明,使用该设计方法后,Alltoall、Reduce、Allreduce及Reduce scatter的性能提高了10%~20%;在1024个进程的测试中,快速傅里叶变换的性能提高了11%。
其他文献
生物特征识别技术是一种重要的身份鉴别方法,已经逐渐成为国内外的一个研究热点和各国竞相发展的重点战略技术。作为一种新兴的生物特征识别技术,眉毛识别的研究处于起步和发
近年来,虚拟化技术以其资源利用率高和隔离封装等特性得到了广泛应用。同时,研究主动防御的网络安全仿真技术,却因成本、对真实环境破坏性及检测系统可靠性等因素难以大规模应用
核方法是目前机器学习领域的研究热点之一,广泛用于模式识别、数据挖掘、信号处理、计算机视觉等多个领域。基于子空间的降维方法则是模式识别的一种主流方法。将两者结合的核
随着计算机应用的不断深入和计算机网络的普及,尤其是作为现代信息社会核心的因特网的开放性,国际性和自由性,使得人们对信息安全的要求越来越高。目前解决安全问题主要是通过系
随着信息技术和计算机互联网飞速发展,多媒体信号已成为人类获取信息的最主要载体,多媒体信号数字化产生的大量的数据对存储和传输都产生了巨大的压力。因此图像数据高效压缩
虚拟现实是当前的研究热点之一,在建筑设计、城市规划、古迹恢复、产品原型、娱乐、可视化仿真等多个领域有着广泛的应用。LOD(细节层次)技术在虚拟现实中的应用提高了系统的
虽然电子不停车收费ETC(Electronic Toll Collection)系统在公路收费方面应用发展很快,但是现有的ETC系统还存在标准不一、安全性不高等许多问题,尤其是现有的ETC数据通信嵌
形式句法翻译(Formally Syntax-based Machine Translation)模型是基于句法的统计机器翻译模型的一个重要分支。与其它模型相比,该类模型使用同步的形式语法来生成译文,模型具
“两化融合”的电网工控系统作为国家关键基础设施至关重要。但在工控安全形势不断严峻的情况下,“两化融合”的电网工控系统因所用工控网络软硬件的不断通用性、网络环境开放性和自身脆弱性,导致针对电网工控系统的网络攻击不断发生。由于与传统互联网安全差异较多,所以作为一个较新的领域,总体来说我国工控领域的网络安全研究仍处于起步阶段。当前电力企业的电网工控系统安全防护中仍存在:网络安全防护方法单一以依赖防火墙等
随着IT科技的发展,我们已步入云计算的时代。对于企业云计算市场,云终端瘦客户机-云服务器解决方案因为具备安全性高、易于管理、相对成本较低、高可靠性等特点,已然成为产业界