机群软件可扩展性及其优化技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:tszl8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机群结构的超级计算机性能已经跨越百万亿次向千万亿次发展,可扩展性一直是超级计算机面临的最大挑战之一。超级计算机在软件层次的可扩展性研究远远滞后于它在系统结构(硬件)层次的可扩展性研究。本文旨在研究机群软件(主要是指MPI并行应用和机群管理软件)的可扩展性及其优化技术。   随着大规模多核处理器机群的出现和普及,给机群软件的性能和可扩展性带来了深远影响。通信开销是影响并行应用可扩展性的关键因素之一,而多核处理器机群带来了更加复杂的存储层次化,严重影响着并行应用的消息通信性能。本文的研究动机之一在于给出多核机群平台上精确的通信性能分析模型以及MPI集合通信的性能优化方法。另外,随着机群规模的不断增大,为了保障超级计算机能够高效可靠地运行,机群管理软件的可扩展性问题变得更加突出。由于机群管理软件是一类特殊的分布式应用,它的性能瓶颈和可扩展性主要受不断增大的机群规模影响,不同于并行应用的可扩展性问题。因此,本文的研究动机之二在于给出机群管理软件的可扩展性计算模型以及机群管理软件的可扩展性优化技术。   本文主要的研究成果或创新点如下:   1.多核处理器机群存储层次化具有纵向和横向两方面特征,目前缺少与之相适应的并行计算模型去有效地分析消息通信性能。本文提出了新的存储层次化并行计算模型,对多核机群存储横、纵向层次化特征进行了统一的抽象。该模型有助于多核机群平台上消息通信性能的精确分析,对MPI集合通信性能的优化具有指导意义。   2.在新的并行计算模型的指导下,针对存储横向层次化特征,提出了多核机群MPI集合通信的性能优化方法。据此方法优化后的广播算法性能提升至少约16.8%。   3.参照并行应用的等效率可扩展性计算模型,本文提出了机群管理软件可扩展性计算模型:TRU效率模型。此模型分析了机群管理软件可扩展性问题的本质,对机群管理软件可扩展性优化具有指导意义。   4.在TRU效率模型的指导下,参照大规模分布式软件的设计方法,提出了可扩展机群管理软件的设计模式,广泛应用于曙光系列超级计算机各种机群管理软件的设计中,从而证实了该设计模式的可行性。
其他文献
军队公积金是军队后勤管理中的一个重要组成部分。中国人民解放军的军官、文职干部、军士长、专业军士、正式职工及军队供养的离退休人员住房建设、维修、管理的专项资金,由
随着计算机科学和通信技术的迅猛发展,传统的计算机辅助医疗技术已经渐渐不能满足广大医务工作者和研究人员的使用需求,他们迫切的需要不受地域限制,通过计算机网络进行辅助
随着IT全球化的快速发展和信息技术的日新月异,RFID和物联网技术已逐渐深入我们生活的方方面面,相关技术及标准的研究和制定也正在进行之中。本文对现有的RFID技术和应用进行
无线传感器网络是一种集成了传感器、嵌入式计算、分布式信息处理和无线通信等技术的新型网络,它在军事领域和民用领域有着巨大的科研价值和应用潜力。在无线传感器网络中因
复杂攻击由一系列有逻辑关系的攻击行为构成,隐蔽性强、破坏性大、威胁范围广,已经成为网络攻击的主要形式之一。如何发现复杂攻击的内在联系,识别其攻击意图和预测下一步攻击行
随着无线网络通信技术和定位技术的发展,移动对象已被广泛地应用到许多领域,例如交通监控、位置信息服务等等。作为数据挖掘领域当中的重要技术,异常点检测技术可以发现数据集当
随着Internet技术的发展,XML作为信息表示和数据交换的标准受到越来越多的关注,如何有效地存储和查询XML数据已经成为当前研究的热点。Twig模式查询是XML查询处理的核心操作,
5G移动通信系统是面向2020年移动通信需求提出的新一代移动通信系统。与现有的移动通信系统相比,5G移动通信系统在无线覆盖能力、传输时延、系统安全和用户体验方面将得到显著
随着Internet的迅速发展,信息共享和数据交换的范围也在不断扩大,XML在跨平台、异构数据集成方面有着相当广泛的应用,但缺乏完善的存储和管理机制。当前,传统的关系数据库依
在网络信息安全问题中,用户的身份认证问题是最基本的。在各种对身份的认证技术中,基于口令的认证方式由于其高效、低廉、便捷等优点,因此使用得最普遍。在基于口令认证的密