IntraGRID环境下通信机制的研究与实现

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:zl9881123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网格以共享资源协同计算为目标将成为今后服务于各领域的基础设施,该设施的核心部件包括高性能计算设备、存储设备和贵重仪器等重要资源。目前,机群系统以其优越的可扩展性、可用性、可靠性和性价比在高性能计算机系统中占有主导地位。随着机群系统的大量部署及其上应用的不断增加,如何联合机群的计算力为分布式高性能计算等网格应用提供更大规模的计算平台,是高性能计算机体系结构研究的一个重要课题。面向网格应用的计算机是高性能计算机体系结构发展的重要方向之一。作为本文研究背景的IntraGRID是一种松散耦合的网格计算机结构,把分布的机群联合成为统一的机算机备,用于执行分布式高性能计算等网格应用。IntraGRID的耦合程度比机群松散,其上的并行算法需要做相应调整,例如通过划分通信密集和通信稀疏的进程组,合理调度进程从而更好的利用这种平台结构的特点。IntraGRID通信系统是IntraGRID的关键部件,为其上的分布式高性能计算环境提供底层通信协议,由机群内的机群通信协议和机群间的外部通信协议构成。IntraGRID通信系统使用统一的协议进行机群的内部和外部通信,能够有效的支持分布式并行计算环境。机群间通信协议由网格网关(Grid Gateway)实现,采用网关式的消息转发机制,该方式区别于MPICH-G2和PACX-MPI等网格使能的MPI计算环境采用外部通信机制,更适合在同构机群组成的IntraGRID中进行高效的消息传递。Grid Gateway连接机群互连网络和机群间的高速IP网络,通过转发不同网络上的消息实现机群间通信。Grid Gateway支持多结点转发,通过分流外部通信的消息能平衡机群间通信时节点的负载。本文介绍了IntraGRID及其通信系统的结构和特征,详细分析了Grid Gateway的实现机制,以及全局标识符、机群间通信语义、流量控制、多重路由机制、负载平衡等关键问题,并且给出了机群间通信协议的设计与实现,对机群间通信协议性能、机群间MPI性能进行评价和分析。
其他文献
龙芯是由中国科学院计算技术研究所自主研制开发的一个通用芯片系列。龙芯1号是其第一个产品。在龙芯1上运行的是Linux系统,使用的编译器是GCC。GCC编译的SPEC2000程序的性能
运动控制器在工业、国防和人们的日常生活中,有着广泛的应用。然而,目前常用的运动控制器体系结构存在很多缺陷,如体积过大,不支持网络通信,硬件一旦固化则不能改变等,从而导致运动控制器之间相互孤立,系统升级过程中大量资源浪费。为了解决这些问题,本文对运动控制器的体系结构进行了研究。 本文首先分析了目前运动控制器常用的体系结构,指出了它们在体积、通信协议、灵活性方面的不足。针对运动控制器的数据安全性
随着软件成为当今社会越来越重要的一个领域,人们对开发有效的、健壮的、复杂的软件需求也日益递增。虽然,我们在计算、网络、编程语言以及软件方法学等方面取得了显著的进步,但
随着时代的发展,远程教育已日益成为传统教育的重要补充.远程教育的发展经历了广播教学,电视教学,网络教学三个阶段,其中网络教学最能代表远程教育的发展方向.在远程教育的实
随着经济的迅速发展和人民生活水平提高,人们对能源的需求逐渐增大,随之产生的能源数据存在容量多、类型杂、复杂性高等特点。因此,如何从能源数据及相关的能源设施中准确、直观
本文首先提出了一种新的多代理在线学习算法LU-Q,该算法通过对联合行动不断地实施剪枝,减少可选行动数目,加快多代理学习的收敛.实验表明,算法学习性能优于标准多代理Q学习.
学位
随着我国“平安城市”、“智慧城市”等国家信息化建设战略的不停推进,视频监控成为视觉信息采集的重要基础设施。视频大数据是大数据的重要组成部分,视频数据不同于其他媒体数
近年来,远程办公、移动计算的应用需求不断增长。在无线应用中,当移动主机在不同的子网之间移动时,为了保证正常通信,必须进行切换。移动IP切换已成为影响无线网络性能的关键问题
网络测量工作表明,网络业务具有自相似性。业务的自相似性对因特网的设计、控制、分析和管理产生了巨大影响。迄今为止,大部分的网络测量仅仅限于有线网范围内。随着无线技术的